由hexo-math 引起的sed 的多行处理问题=。=
互质整数的最大不能表示数
想找个高大上的定理名字的,可惜实在搜不到。。。。只好用这么SB的名字了。。。。。东西很简单:当两数 $a,b$ 互质时, $ax+by\quad x>0,y>0$ 不能表示的最大数为 $ab-a-b$
finite state markov chain
markov chain是markov process的基础。当然,对markov chain的了解是markov process的基础。
possion process
arrival process中重要的成员,泊松过程(虽然不知道英文发音是posong为啥汉语是bosong)。
漫谈大数定律
私以为大数定律是整个概率论中最重要也最核心的定律之一。它是整个概率论成立的基础。本章是对MIT的stochastic process第一章的整理。
简谈L0,L1和L2
L1和L2是ml中常用的惩罚系数,虽然L0不是,但是既然有L1,L2了,也带上L0。我们在这里主要说一说L0,L1,L2的具体作用。
稀疏表示
参数的稀疏性在machine learning,尤其是deep learning中是一个很重要的话题。故名思意,稀疏表示就是指训练出的参数是稀疏的,即包含很多的0
神经网络-RNN
RNN是神经网络中处理时序数据的重要model。所谓时序数据,就是数据集中每个样本不是独立的,会与前面数个或者后面数个样本产生联系。自然语言以及音频都是典型的时序数据。
神经网络 CNN
脑洞大开的机器学习江湖史——CNN横空出世,图像识别天下一统
神经网络 ReLU,cross entropy and softmax
神经网络的外功改进——ReLU,cross entropy以及softmax。
话说BP虽然横空出世,但是还是留下了梯度消失这种绝世难题。死穴放在那,怎么能行走于机器学习的江湖?内功不好改,我们先从外功入手。