计算广告-知识储备

1、信息检索

1.1、倒排索引

​ 核心目的,将从大量文档中查找包含某些词的文档集合,用O(1)的时间复杂度完成。

​ 基本操作:

​ 1、向索引中加入一个新文档

​ 2、给定一个有多个关键词组成的查询时,返回对应的文档集合

1.2、向量空间模型

​ 向量空间模型(Vector Space Model ,VSM),信息检索中最基础且最重要的文档相似度度量方法之一。

​ 核心:

​ 1、文档的表示方法

​ 用各个关键词(term)在文档中强度组成的矢量来表示该文档
\[ D=(X_1,X_2,...X_m)^T \]

​ 2、相似度计算方法

2、最优化方法

2.1、下降单纯型法

2.2、梯度方法

2.3、拟牛顿方法

2.4、Trust-Region方法

2.5、带约束 优化和拉格朗日法

3、统计机器学习

3.1、最大熵原理

3.2、指数族分布

3.3、混合模型和EM算法

3.4、贝叶斯学习

3.5、共轭先验

3.6、经验贝叶斯

3.7、变分法


About ME

👋 读书城南,🤔 在未来面前,我们都是孩子~
  • 📙 一个热衷于探索学习新方向、新事物的智能产品经理,闲暇时间喜欢coding💻、画图🎨、音乐🎵、学习ing~
👋 Social Media
👋 加入小组~

👋 感谢打赏~