LeNet (p.kaun.1.0.0~alpha2.doc.kaun.models.Kaun

Sourcetype config = {

num_classes : int;
(*
Number of output classes (default: 10 for digits)
*)
input_channels : int;
(*
Number of input channels (default: 1 for grayscale)
*)
input_size : int * int;
(*
Input image size (default: 32x32)
*)
activation : [ `tanh | `relu | `sigmoid ];
(*
Activation function (original used tanh)
*)
dropout_rate : float option;
(*
Optional dropout rate for regularization
*)

}

Configuration for LeNet-5 model

Sourceval default_config : config

Default configuration (original LeNet-5 for MNIST)

Sourceval mnist_config : config

MNIST-specific configuration (28x28 input, padded to 32x32)

Sourceval cifar10_config : config

CIFAR-10 configuration (32x32 RGB input)

Sourcetype t = Kaun.module_

LeNet-5 model instance

Sourceval create : ?config:config -> unit -> t

Create a new LeNet-5 model

create ?config () creates a new LeNet-5 model.

Architecture:

Conv1: 6 filters of 5x5
Pool1: 2x2 average pooling
Conv2: 16 filters of 5x5
Pool2: 2x2 average pooling
FC1: 120 units
FC2: 84 units
Output: num_classes units

The original paper used average pooling and tanh activation, but modern implementations often use max pooling and ReLU.

Example:

  let model = LeNet.create ~config:LeNet.mnist_config () in
  let params = Kaun.init model ~rngs ~dtype:Float32 in
  let output = Kaun.apply model params ~training:false input in

Sourceval for_mnist : unit -> t

Create model for MNIST

for_mnist () creates a LeNet-5 model configured for MNIST digits. Equivalent to create ~config:mnist_config ().

Sourceval for_cifar10 : unit -> t

Create model for CIFAR-10

for_cifar10 () creates a LeNet-5 model configured for CIFAR-10. Uses 3 input channels for RGB images.

Source

val forward : 
  model:t ->
  params:Kaun.params ->
  training:bool ->
  input:(float, 'a) Rune.t ->
  (float, 'a) Rune.t

Forward pass through the model

forward ~model ~params ~training ~input performs a forward pass.

parameter model
The LeNet-5 model

parameter params
Model parameters

parameter training
Whether in training mode (affects dropout if configured)

parameter input
Input tensor of shape batch_size; channels; height; width

returns
Output logits of shape batch_size; num_classes

Source

val extract_features : 
  model:t ->
  params:Kaun.params ->
  input:(float, 'a) Rune.t ->
  (float, 'a) Rune.t

Extract feature representations

extract_features ~model ~params ~input extracts feature representations from the second-to-last layer (FC2), useful for transfer learning or visualization. Returns features of shape batch_size; 84.

Sourceval num_parameters : Kaun.params -> int

Model statistics

num_parameters params returns the total number of parameters in the model.

Sourceval parameter_breakdown : Kaun.params -> string

parameter_breakdown params returns a detailed breakdown of parameters by layer.

Training Helpers

Sourcetype train_config = {

learning_rate : float;
batch_size : int;
num_epochs : int;
weight_decay : float option;
momentum : float option;

}

Training configuration

Sourceval default_train_config : train_config

Default training configuration for MNIST

Source

val accuracy : 
  predictions:(float, 'a) Rune.t ->
  labels:(int, Rune.int32_elt) Rune.t ->
  float

Compute accuracy

accuracy ~predictions ~labels computes classification accuracy. Predictions should be logits of shape batch_size; num_classes, labels should be class indices of shape batch_size.