基于NLP的Bert中文文本分类

如果看不懂这一块可以移步深度学习板块先去了解基础。尽可能使用比较好的硬件，模块介绍首先理解代码中使用的模块，可以更快的上手，省去了查询的时间。 transformers BertTokenizer BertTokenizer是用于将文本转换为BERT模型可以接受的输入格式的工具类。它负责将原

Xzro

发布于 2024年05月06日

深度学习之平均梯度计算及梯度更新

介绍在训练时，我们需要提供许多样本，在同一特征值和偏置下，我们需要对这些样本依次求损失率和梯度，然后求出在此特征值和偏置下的平均损失率和平均梯度，用于梯度下降算法的更新。平均梯度计算计算参数的梯度为：d(w1)i，d(w2)i，d(b)i，提供了n个样本，求最终的dw1，dw2，db，如何去设

Xzro

发布于 2024年04月30日

目的在上一篇文章中，我们通过成本函数可以求出关于w和偏置b所对应的一个损失率，损失率越小，说明预测越接近结果值，所以梯度下降算法就是得到J(w,b)函数中，最小的损失率，也就是J(w,b) 的最小值。介绍我们先来展示J(w,b)函数的三维图：这张三维图可以看出，j(w,b)的值会因w,b的不

Xzro

发布于 2024年04月30日

介绍线性回归在介绍逻辑回归算法之前，我们来先来讲一个例子，来介绍线性回归。当顾客去挑选一件商品时，我们需要预测顾客挑选这个商品的概率。这个商品包含了许多特征Xn来吸引客户，这些特征值包含了不同的权重Wn，还有一个偏置b，那么线性回归的的结果就是w1x1+w2x2+...+wnxn+b 逻辑回归

Xzro

发布于 2024年04月29日