diff --git a/Cargo.toml b/Cargo.toml
index 7fa026d81..dc1cc9d1c 100644
--- a/Cargo.toml
+++ b/Cargo.toml
@@ -53,6 +53,7 @@ libc = "0.2"
 num  = "0.4.0"
 lazy_static = "1.0"
 half = "1.5.0"
+mnist = {version="0.5.0", features = ["download"]}
 serde = { version = "1.0", features = ["derive"], optional = true }
 
 [dev-dependencies]
@@ -101,3 +102,8 @@ path = "examples/fft.rs"
 [[example]]
 name = "using_half"
 path = "examples/using_half.rs"
+
+[[example]]
+name = "neural_network"
+path = "examples/neural_network.rs"
+
diff --git a/examples/neural_network.rs b/examples/neural_network.rs
new file mode 100644
index 000000000..e7a49cdff
--- /dev/null
+++ b/examples/neural_network.rs
@@ -0,0 +1,389 @@
+use self::{
+    ann::ArtificialNeuralNetworkBuilder, arrayfire_mnist::ArrayfireNormalizedMnist, model::Model,
+};
+
+use arrayfire::Array;
+
+use mnist::MnistBuilder;
+
+pub(crate) mod arrayfire_mnist {
+    use arrayfire::{dim4, transpose, Array};
+    use mnist::NormalizedMnist;
+
+    pub const TRAINING_SET_SIZE: u32 = 6_000;
+    pub const VALIDATION_SET_SIZE: u32 = 1_000;
+    pub const TEST_SET_SIZE: u32 = 1_000;
+    pub const IMAGE_DIMENSION: usize = 28;
+    pub struct ArrayfireNormalizedMnist {
+        pub training_labels: Array<u8>,
+        pub training_images: Array<f32>,
+        pub validation_labels: Array<u8>,
+        pub validation_images: Array<f32>,
+        pub testing_labels: Array<u8>,
+        pub testing_images: Array<f32>,
+    }
+
+    impl From<&NormalizedMnist> for ArrayfireNormalizedMnist {
+        fn from(mnist_data: &NormalizedMnist) -> Self {
+            let training_images = Array::new(
+                &mnist_data.trn_img,
+                dim4![
+                    (IMAGE_DIMENSION * IMAGE_DIMENSION) as u64,
+                    TRAINING_SET_SIZE as u64,
+                    1,
+                    1
+                ],
+            );
+            let training_labels = Array::new(
+                &mnist_data.trn_lbl,
+                dim4![10, TRAINING_SET_SIZE as u64, 1, 1],
+            );
+
+            let testing_images = Array::new(
+                &mnist_data.tst_img,
+                dim4![
+                    (IMAGE_DIMENSION * IMAGE_DIMENSION) as u64,
+                    TEST_SET_SIZE as u64,
+                    1,
+                    1
+                ],
+            );
+            let testing_labels =
+                Array::new(&mnist_data.tst_lbl, dim4![10, TEST_SET_SIZE as u64, 1, 1]);
+
+            let validation_images = Array::new(
+                &mnist_data.val_img,
+                dim4![
+                    (IMAGE_DIMENSION * IMAGE_DIMENSION) as u64,
+                    VALIDATION_SET_SIZE as u64,
+                    1,
+                    1
+                ],
+            );
+            let validation_labels = Array::new(
+                &mnist_data.val_lbl,
+                dim4![10, VALIDATION_SET_SIZE as u64, 1, 1],
+            );
+
+            ArrayfireNormalizedMnist {
+                training_labels: transpose(&training_labels, false),
+                training_images: transpose(&training_images, false),
+                validation_labels: transpose(&validation_labels, false),
+                validation_images: transpose(&validation_images, false),
+                testing_labels: transpose(&testing_labels, false),
+                testing_images: transpose(&testing_images, false),
+            }
+        }
+    }
+}
+pub(crate) mod model {
+    use arrayfire::Array;
+    pub trait Model {
+        fn predict(&self, feature: &Array<f32>) -> Array<f32>;
+
+        fn train(
+            &mut self,
+            training_features: &Array<f32>,
+            training_labels: &Array<u8>,
+            validation_features: &Array<f32>,
+            validation_labels: &Array<u8>,
+            learning_rate_alpha: f64,
+            max_epochs: i32,
+            batch_size: i32,
+            max_err: f64,
+        ) -> f64;
+    }
+}
+mod ann {
+    use super::model::Model;
+    use arrayfire::{
+        constant, dim4, index, join, matmul, seq, sigmoid, sum_all, transpose, Array, MatProp,
+    };
+    pub struct ArtificialNeuralNetwork {
+        weights: Vec<Array<f32>>,
+        num_layers: usize,
+    }
+
+    pub struct ArtificialNeuralNetworkBuilder {
+        feature_width: usize,
+        layer_widths: Vec<usize>,
+        label_width: usize,
+        initial_random_range: f32,
+        num_layers: usize,
+    }
+
+    impl ArtificialNeuralNetworkBuilder {
+        pub fn new() -> ArtificialNeuralNetworkBuilder {
+            ArtificialNeuralNetworkBuilder {
+                feature_width: 0,
+                label_width: 0,
+                num_layers: 2,
+                layer_widths: vec![],
+                initial_random_range: 0.05,
+            }
+        }
+
+        pub fn with_feature_width(
+            &mut self,
+            feature_width: usize,
+        ) -> &mut ArtificialNeuralNetworkBuilder {
+            self.feature_width = feature_width;
+            self
+        }
+
+        pub fn with_label_width(
+            &mut self,
+            label_width: usize,
+        ) -> &mut ArtificialNeuralNetworkBuilder {
+            self.label_width = label_width;
+            self
+        }
+
+        pub fn add_hidden_layer(
+            &mut self,
+            layer_width: usize,
+        ) -> &mut ArtificialNeuralNetworkBuilder {
+            self.layer_widths.push(layer_width);
+            self.num_layers += 1;
+            self
+        }
+
+        pub fn with_initial_random_range(
+            &mut self,
+            range: f32,
+        ) -> &mut ArtificialNeuralNetworkBuilder {
+            self.initial_random_range = range;
+            self
+        }
+
+        pub fn build(&self) -> ArtificialNeuralNetwork {
+            let mut widths: Vec<usize> = vec![];
+            widths.push(self.feature_width);
+            widths.append(&mut self.layer_widths.clone());
+            widths.push(self.label_width);
+
+            let mut weights = vec![];
+            for index in 0..(widths.len() - 1) {
+                weights.push(
+                    self.initial_random_range
+                        * arrayfire::randu::<f32>(dim4![
+                            widths[index] as u64 + 1,
+                            widths[index + 1] as u64,
+                            1,
+                            1
+                        ])
+                        - self.initial_random_range / 2f32,
+                )
+            }
+            ArtificialNeuralNetwork {
+                weights,
+                num_layers: self.num_layers,
+            }
+        }
+    }
+
+    impl Model for ArtificialNeuralNetwork {
+        fn train(
+            &mut self,
+            training_features: &Array<f32>,
+            training_labels: &Array<u8>,
+            validation_features: &Array<f32>,
+            validation_labels: &Array<u8>,
+            learning_rate_alpha: f64,
+            max_epochs: i32,
+            batch_size: i32,
+            max_err: f64,
+        ) -> f64 {
+            let number_of_training_samples = training_features.dims()[0] as i32;
+            let number_of_batches_in_training_set = number_of_training_samples / batch_size;
+
+            let validation_batch_size = 1;
+
+            let _number_of_validation_samples = validation_features.dims()[0] as i32;
+            let number_of_batches_in_validation_set = 1; //number_of_validation_samples / validation_batch_size;
+
+            let mut avg_error = 0f64;
+
+            for epoch in 0..max_epochs {
+                let mut errors = Vec::with_capacity(number_of_batches_in_validation_set as usize);
+                for training_batch in 0..number_of_batches_in_training_set {
+                    let start = training_batch * batch_size;
+                    let end = start + batch_size - 1;
+
+                    let features = index(training_features, &[seq![start, end, 1], seq!()]);
+                    let labels = index(training_labels, &[seq![start, end, 1], seq!()]);
+
+                    let signals = self.forward_propagate(&features);
+
+                    self.back_propagate(&signals, &labels, learning_rate_alpha);
+                }
+
+                for validation_batch in 0..number_of_batches_in_validation_set {
+                    let start = validation_batch * validation_batch_size;
+                    let end = start + validation_batch_size - 1;
+
+                    let prediction =
+                        self.predict(&index(validation_features, &[seq![start, end, 1], seq!()]));
+
+                    let target = &index(validation_labels, &[seq![start, end, 1], seq!()]);
+
+                    errors.push(Self::error(&prediction, target));
+                }
+
+                avg_error = errors.clone().into_iter().sum::<f64>()
+                    / (number_of_batches_in_validation_set) as f64;
+                if avg_error < max_err {
+                    println!("Converged on Epoch: {}", epoch + 1);
+                    return avg_error;
+                }
+
+                if (epoch + 1) % 10 == 0 {
+                    println!("Epoch: {}, Error: {}", epoch + 1, avg_error);
+                }
+            }
+            return avg_error;
+        }
+
+        fn predict(&self, input: &Array<f32>) -> Array<f32> {
+            let signal = self.forward_propagate(input);
+            signal.last().unwrap().copy()
+        }
+    }
+
+    impl ArtificialNeuralNetwork {
+        fn forward_propagate(&self, input: &Array<f32>) -> Vec<Array<f32>> {
+            //first layer is the input
+            let mut signal = Vec::with_capacity(self.num_layers);
+
+            signal.push(input.copy());
+
+            for layer_index in 0..(self.num_layers - 1) {
+                let signal_with_bias: Array<f32> = Self::add_bias(&signal[layer_index]);
+                let output = matmul(
+                    &signal_with_bias,
+                    &self.weights[layer_index],
+                    MatProp::NONE,
+                    MatProp::NONE,
+                );
+                signal.push(sigmoid(&output));
+            }
+
+            signal
+        }
+
+        fn add_bias(array: &Array<f32>) -> Array<f32> {
+            join(
+                1,
+                &constant::<f32>(1f32, dim4![array.dims()[0], 1, 1, 1]),
+                array,
+            )
+        }
+
+        fn deriv(out: &Array<f32>) -> Array<f32> {
+            out * (1 - out)
+        }
+
+        fn back_propagate(
+            &mut self,
+            signals: &Vec<Array<f32>>,
+            labels: &Array<u8>,
+            learning_rate_alpha: f64,
+        ) {
+            let mut output = signals.last().unwrap();
+            let mut error = output - labels;
+
+            let m = labels.dims()[0] as i32;
+
+            for layer_index in (0..self.num_layers - 1).rev() {
+                let signal = Self::add_bias(&signals[layer_index]);
+                let delta = transpose(&(Self::deriv(output) * error), false);
+
+                let tg =
+                    learning_rate_alpha * matmul(&delta, &signal, MatProp::NONE, MatProp::NONE);
+                let gradient = -(tg) / m;
+                self.weights[layer_index] += transpose(&gradient, false);
+
+                output = &signals[layer_index];
+
+                let err = &matmul(
+                    &transpose(&delta, false),
+                    &transpose(&self.weights[layer_index], false),
+                    MatProp::NONE,
+                    MatProp::NONE,
+                );
+
+                error = index(&err, &[seq!(), seq!(1, output.dims()[1] as i32, 1)]);
+            }
+        }
+
+        fn error(prediction: &Array<f32>, target: &Array<u8>) -> f64 {
+            let dif = (prediction - target) * 1f64;
+            let sum = sum_all(&(&dif * &dif)).0;
+            sum.sqrt()
+        }
+    }
+}
+
+fn accuracy(predicted: &Array<f32>, target: &Array<f32>) -> f32 {
+    let (_target_maximums, target_max_indices) = arrayfire::imax(target, 1);
+    let (_predicted_maximums, predicted_max_indices) = arrayfire::imax(predicted, 1);
+
+    let (matches, _) = arrayfire::count_all(&arrayfire::eq(
+        &target_max_indices,
+        &predicted_max_indices,
+        false,
+    ));
+    return 100f32 * matches as f32 / target_max_indices.elements() as f32;
+}
+
+fn main() {
+    arrayfire::info();
+    println!("** ArrayFire-Rust ANN Demo **\n");
+
+    let mnist = MnistBuilder::new()
+        .label_format_one_hot()
+        .training_set_length(50_000)
+        .validation_set_length(10_000)
+        .test_set_length(10_000)
+        .download_and_extract()
+        .finalize()
+        .normalize();
+
+    let mnist = ArrayfireNormalizedMnist::from(&mnist);
+
+    let mut model = ArtificialNeuralNetworkBuilder::new()
+        .with_feature_width(28 * 28)
+        .with_label_width(10)
+        .add_hidden_layer(100)
+        .add_hidden_layer(50)
+        .with_initial_random_range(0.05f32)
+        .build();
+
+    model.train(
+        &mnist.training_images,
+        &mnist.training_labels,
+        &mnist.validation_images,
+        &mnist.validation_labels,
+        2.0,
+        250,
+        100,
+        0.05,
+    );
+
+    let train_output = model.predict(&mnist.training_images);
+    let test_output = model.predict(&mnist.testing_images);
+
+    arrayfire::sync(arrayfire::get_device());
+
+    println!("\nTraining set:");
+    println!(
+        "Accuracy on training data: {}",
+        accuracy(&train_output, &(mnist.training_labels * 1f32)),
+    );
+
+    println!("\nTest set:");
+    println!(
+        "Accuracy on testing  data: {}",
+        accuracy(&test_output, &(mnist.testing_labels * 1f32)),
+    );
+}