CTR模型归纳来说就是三种类型的特征作为输入
int list即 id listfloat list即一些比如价格、销量等特征fixed float list即固定的embedding
·
int list
即 id list,输入模型后embedding_lookup
float list
float归一化后直接输入(即经过 [1, emb_dim] 的网络)
即一些比如价格、销量(归一化后)等特征
# input_feature_total_number 是 input_feature 有这么多维的float
emb_matrix = tf.get_variable(feature_name, [1, input_feature_total_number, emb_dim])
input_feature = tf.expand_dims(input_feature, -1) # 结果是[batch_size, input_feature_total_number, 1]
embed_feature = tf.multiply(input_feature, emb_matrix) # 结果是[batch_size, input_feature_total_number, emb_dim]
# 相当于每个float是1维特征,每一float维特征 经过 [1,emb_dim]的网络 转为 emb_dim维
float分桶转成int后再embedding输入,其实也是 int list
即比如 十等分或一百等分

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)