计算广告-知识储备
计算广告-知识储备
1、信息检索
1.1、倒排索引
核心目的,将从大量文档中查找包含某些词的文档集合,用O(1)的时间复杂度完成。
基本操作:
1、向索引中加入一个新文档
2、给定一个有多个关键词组成的查询时,返回对应的文档集合
1.2、向量空间模型
向量空间模型(Vector Space Model ,VSM),信息检索中最基础且最重要的文档相似度度量方法之一。
核心:
1、文档的表示方法
用各个关键词(term)在文档中强度组成的矢量来表示该文档
\[
D=(X_1,X_2,...X_m)^T
\]
2、相似度计算方法
2、最优化方法
2.1、下降单纯型法
2.2、梯度方法
2.3、拟牛顿方法
2.4、Trust-Region方法
2.5、带约束 优化和拉格朗日法
3、统计机器学习
3.1、最大熵原理
3.2、指数族分布
3.3、混合模型和EM算法
3.4、贝叶斯学习
3.5、共轭先验
3.6、经验贝叶斯
3.7、变分法
About ME
👋 读书城南,🤔 在未来面前,我们都是孩子~
- 📙 一个热衷于探索学习新方向、新事物的智能产品经理,闲暇时间喜欢coding💻、画图🎨、音乐🎵、学习ing~
👋 Social Media
🛠️ Blog: http://oceaneyes.top
⚡ PM导航: https://pmhub.oceangzy.top
☘️ CNBLOG: https://www.cnblogs.com/oceaneyes-gzy/
🌱 AI PRJ自己部署的一些算法demo: http://ai.oceangzy.top/
📫 Email: 1450136519@qq.com
💬 WeChat: OCEANGZY
💬 公众号: UncleJoker-GZY
👋 加入小组~
👋 感谢打赏~
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 OCAEN.GZY读书城南!