基于NLP的Bert中文文本分类
如果看不懂这一块可以移步深度学习板块先去了解基础。 尽可能使用比较好的硬件, 模块介绍 首先理解代码中使用的模块,可以更快的上手,省去了查询的时间。 transformers BertTokenizer BertTokenizer是用于将文本转换为BERT模型可以接受的输入格式的工具类。 它负责将原
深度学习
未读
深度学习之平均梯度计算及梯度更新
介绍 在训练时,我们需要提供许多样本,在同一特征值和偏置下,我们需要对这些样本依次求损失率和梯度,然后求出在此特征值和偏置下的平均损失率和平均梯度,用于梯度下降算法的更新。 平均梯度计算 计算参数的梯度为:d(w1)i,d(w2)i,d(b)i,提供了n个样本,求最终的dw1,dw2,db,如何去设
深度学习
未读
深度学习之梯度下降算法
目的 在上一篇文章中,我们通过成本函数可以求出关于w和偏置b所对应的一个损失率,损失率越小,说明预测越接近结果值,所以梯度下降算法就是得到J(w,b)函数中,最小的损失率,也就是J(w,b) 的最小值。 介绍 我们先来展示J(w,b)函数的三维图: 这张三维图可以看出,j(w,b)的值会因w,b的不
深度学习
未读
深度学习之逻辑回归(logistic)
介绍 线性回归 在介绍逻辑回归算法之前,我们来先来讲一个例子,来介绍线性回归。当顾客去挑选一件商品时,我们需要预测顾客挑选这个商品的概率。这个商品包含了许多特征Xn来吸引客户,这些特征值包含了不同的权重Wn,还有一个偏置b,那么线性回归的的结果就是w1x1+w2x2+...+wnxn+b 逻辑回归