模型功能

列举一个模型:实现判别男女的功能,也即表示模型对样本所表示的人的性别做出判断。

输入输出

一个模型接受3个收入,1个输出。作为输入的数值,称为特征,它们描述现实世界的一个事物。作为输出的数值,称为标签,它们描述判断一个样本结果是否计算正确。

3个输入分别是一个人的身高、体重和体脂率。
1个输出是0或1,0代表女性,1代表男性。

用这3个特征代表一个人,它们构成一个样本(sample)。

这3个特征经过某些计算(模型),最后输出一个数值0或1。

分别列举一个男性和女性的样本

格式:(身高,体重,体脂率)(Height, weight, body fat percentage)(H,W,BFP)
女性:

(162,49,0.22)

男性:

(182,72,0.17)

模型内部运算

f ( x ) = 1.0 ∗ H + 1.0 ∗ W − 100.0 ∗ B F P (1.0) f(x)=1.0*H+1.0*W-100.0*BFP\tag{1.0} f(x)=1.0H+1.0W100.0BFP(1.0)
y = { 1 , f ( x ) ≥ 200 ; 0 , f ( x ) < 200 , (1.1) y=\begin{cases} 1, & f(x)≥200; \\ 0, & f(x)<200, \end{cases}\tag{1.1} y={1,0,f(x)200;f(x)200,(1.1)

问题

权重问题 — 保证某个特征不被其他特征淹没为前提。

为什么身高和体重的权重为1.0 ,而体脂率的权重为100.0?

普遍性,男性身高和体重大于女性,用权重1.0乘以身高和体重,男性相比女性得到较大的值。另外,女性在体脂率这块,大于男性,将权重-100.0赋予体脂率,女性会得到更小(绝对值更大)的负值。
体脂率在量级上是身高或体重的百分之一(例如,0.17对182或72),所以权重的绝对值较大(100.0),这使体脂率的作用不至于被其他特征淹没。

分界点 — 和阈值有关

为什么以200为分界点?

因为目前就两个样本来说,男性样本计算出来的值是237,女性样本计算出来的值是189,恰好以200为分界点能分开这仅有的两个样本。

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐