分类 ML&DL 中的文章

一站式机器学习云开发平台

本篇是关于自身在机器学习这块工作经验的思考总结 我希望构建一个机器学习云开发平台,目标在于解决以下问题: 团队协作:项目管理,技术&业务的共享如何体现在实际解决问题的过程中; 资源调度:数据处理、模型训练; 模块共享:低代码甚至无代码; 快速开发:快速试错、实践、测试、部署; 需求-……

阅读全文

梯度下降推导

以感知器为例,可以梯度下降来学习合适的权重和偏置: 假设有n个样本,第i次的实际输出为y,对于样本的预测输出可以表示为: \[ \bar{y}^i = w_1x_1^i+w_2x_2^i+...+w_nx_n^i+b \] 任意一个样本的实际输出和预测输出单个样本的误差,可以使用MES表示: \[ e^i=\frac{1}{2}(y^i-\bar{y}^i)^{2} \] 那么所有误差的和可以表示为: \[ \begin{aligned} E &= e^1+e^2+...+e^n \\ &= \sum_{i=1}^ne^i \\ &= \frac{1}{2}\sum_{i=1}^n(y^i-w^Tx^i)^2 \end{aligned} \] 想象一下,当你从山顶往下……

阅读全文

nndl_note: 深度神经⽹络为何很难训练

消失的梯度问题 导致梯度消失的原因 在更加复杂⽹络中的不稳定梯度 其它深度学习的障碍 上一章提到了神经网络的一种普遍性,比如说不管目标函数是怎样的,神经网络总是能够对任何可能的输入得到一个近似的输出。 普遍性告诉我们神经⽹络能计算任何函数;而实际经验依据提⽰深度⽹络最能适⽤于学习能够解决许……

阅读全文

nndl_note: 神经⽹络可以计算任何函数的可视化证明

两个预先声明 一个输入和一个输出的普遍性 多个输入变量 S型神经元的延伸 修补阶跃函数 结论 本章其实和前面章节的关联性不大,所以大可将本章作为小短文来阅读,当然基本的深度学习基础还是要有的。 主要介绍了神经⽹络拥有的⼀种普遍性,比如说不管目标函数是怎样的,神经网络总是能够对任何可能的输入$x……

阅读全文

nndl_note: 改进神经⽹络的学习⽅法

交叉熵代价函数 引⼊交叉熵代价函数 交叉熵的含义?源⾃哪⾥? 过度拟合和规范化 规范化 为何规范化可以帮助减轻过度拟合 规范化的其他技术 权重初始化 如何选择神经⽹络的超参数 参考 万丈高楼平地起,反向传播是深度学习这栋大厦的基石,所以在这块花多少时间都是值得的 前面一章,我们深入理解了反向传播算法如……

阅读全文

nndl_note: 反向传播算法如何工作

热⾝:神经⽹络中使⽤矩阵快速计算输出的⽅法 关于代价函数的两个假设 反向传播的四个基本方程 输出层误差的⽅程 使用下一层的误差表示当前层的误差 代价函数关于⽹络中任意偏置的改变率 代价函数关于任何⼀个权重的改变率 反向传播算法 反向传播:全局观 参考 前面一章,我们通过了梯度下降算法实现目标函数的最……

阅读全文

nndl_note: 识别手写字

感知器 S型神经元 神经⽹络的架构 ⼀个简单的分类⼿写数字的⽹络 随机梯度下降算法 实现数字分类模型 参考 Neural Networks and Deep Learning 是由 Michael Nielsen 编写的开源书籍,这本书主要讲的是如何掌握神经网络的核心概念,包括现代技术的深度学习,为你将来使⽤神经网络和深度学习打下基础,以下是我的读书笔记。 神经网络是一门重要的机器……

阅读全文

神经网络基础

要想入门以及往下理解深度学习,其中一些概念可能是无法避免地需要你理解一番,比如,备份地址: 什么是感知器 什么是神经网络 张量以及运算 微分 梯度下降 带着问题出发 在开始之前希望你有一点机器学习方面的知识,解决问题的前提是提出问题,我们提出这样一个问题,对MNIST数据集进行分析,然后在解决……

阅读全文

读 Character-level CNN for Text Classification

这篇论文提供了一个关于字符级卷积网络(ConvNets)在文本分类中应用实证研究,我们构建了几个大型数据集,以表明字符级卷积网络可以实现最先进的或竞争性的结果,针对传统模型(如词袋,n-gram及其TFIDF变体)和深度学习模型(如基于单词的ConvNets和循环神经网络)进行比……

阅读全文

如何用Python创建一个简单的神经网络

如何用Python创建一个简单的神经网络 原文地址:How to Create a Simple Neural Network in Python 作者:Dr. Michael J. Garbade 翻译:howie6879 理解神经网络如何工作的最好方式是自己动手创建一个,这篇文章将会给你演示怎么做到这一点 神经网络(NN),也称之为人工神经网络(ANN),它是机器学习领域中学习算法集合中……

阅读全文