内容类产品——个性化推荐和热度算法
1 初期阶段
个性化推荐不是产品首次发布就能自带的。无论是基于用户行为的个性化,还是基于内容相似度的个性化,都建立在大量的用户数和内容的基础上。
产品发布之初,一般两遍的数据都有残缺,因此个性化推荐并不能完整开展。
故,产品发展初期
推荐内容一般采用更加聚合的“热度算法”,把热点的内容有限推荐给用户;虽无法做到基于兴趣和习惯为每一个用户做到准确化推荐,但能覆盖到大部分用户需求,而且启动成本比个性化推荐算法低很多。
2 热度算法
2.1 热度算法基本原理
新闻热度分 = 初始热度分 + 用户交互产生的热度分 –
随时间衰减的热度分
Score = S0 + S(Users) – S(Time)
1、新闻入库后,被系统赋予一个初始热度值,该新闻进入推荐列表进行排序
2、随着新闻不断被用户点击阅读,收藏,分享......
用户行为被视作帮助提升新闻热度,系统需要为每种新闻重新赋予热度值
3、同时,新闻自身具有较强的实效性,随着时间的变化而变的陈旧,进而热度衰减
2.2 初始热度需要不一致
由于不同的新闻本身属性所在,受欢迎程度是不一样的。
如:娱乐类比文化类受欢迎程度高;
某 ...
用户体验地图
概述
用户体验地图(User Experience Map),也被叫 User/CustomerJourney
Map,它是用户增长策略体系的一部分,是产品优化的重要工具。
它从用户视角了解产品流程,可以帮助我们找到用户的痛点、发现产品存在问题的阶段,从而有的放矢地进行优化,因此它更适用于产品从1-∞的阶段(0-1阶段的产品的用户是虚拟的、数据是缺失的,因此整个体验地图可靠性低)。
img
△ Crash-Course-CX
组成
一个标准的用户体验地图一般包含以下三大组成部分:
用户:用户画像(persona)、用户目标(user goals/needs);
用户和产品:用户行为(doing)、触点(touch
point)、想法(thinking)、情绪曲线(feeling/experience);
产品机会:痛点(pain point)、机会点(opportunities)。
img
△ 三大部分
如下图,raileurope体验地图,它的时间比较早,但因为非常全面和标准,包含体验地图相关的所有要素,至今仍然被各大公司当作参照的模板。
原版是英文,为了方便大家理解 ...
Python数据挖掘——概要
一、数据挖掘过程
1.数据选择
分析业务需求后,选择应用于需求业务相关的数据:业务原始数据、公开的数据集、也可通过爬虫采集网站结构化的数据。明确业务需求并选择好针对性的数据是数据挖掘的先决条件。
2.数据预处理
通常选择好的数据会有噪音,不完整等缺陷,需要对数据进行清洗,缺失项处理,集成,转换以及归纳:
python字符串处理(相当方便)、正则式匹配、pandas、beautifulsoup处理Html标签等等工具。
3.特征工程/数据转换
根据选择的算法,对预处理好的数据提取特征,并转换为特定数据挖掘算法的分析模型。
4.数据挖掘
使用选择好的数据挖掘算法对数据进行处理后得到信息。
5.解释与评价
对数据挖掘后的信息加以分析解释,并应用于实际的工作领域。
二、数据挖掘常用算法简介
1.关联分析算法
关联规则在于找出具有最小支持度阈值和最小置信度阈值的不同域的数据之间的关联。在关联规则的分析算法研究中,算法的效率是核心的问题。
经典的算法有:Apriori算法,AprioriTid算法,FP-growth算法;
2.分类算法
决策树算法:以树形结构表示分类或者决策集合,产生规则或者发现 ...
常见的研究者认知偏误
常见的研究者认知偏误
前言:
认知偏误(Cognitive
bias)是一种常见的现象,它是指当我们思考问题或做决策时,大脑会有一些固定的思维倾向。这个过程多是无意识的,有时也会带来正面作用,如帮助我们在纷繁复杂的环境中节省思考时间,更高效地做出决定但是在研究中,认知偏误易导致研究结果不准确,降低研究的价值。
我们都希望研究是客观、理性、反映真实情况的,了解常见的认知偏误可以帮助我们在工作中尽量规避它们,得出更准确的结论。
实际上每个人都会有认知偏误,包括用户研究者和用户。
今天我们就来说说研究者的常见认知偏误,下次有机会再谈谈用户的,敬请期待。
一、 确认偏误(Confirmation
bias)
当人们本来就持有某种观点时,对这种观点的感知和注意度会被放大,会选择性地回忆或收集关于它的事例。人们对于自己原本就相信的观点会更容易接受,而把反面观点搁置在一旁。举个例子:有些人认为女司机不擅长开车,更容易造成事故,所以当新闻中的事故与女司机有关时,他们会觉得“果然如此”。而实际上男司机的事故率比女司机更高。
在用户研究中,当你的预设想法是用户对A设计的满意度比B设计更高时,在研究中你可能 ...
php开发APP后端---环境准备
环境和工具
集成环境
phpstudy
xampp
mamp
工具
PHP开发工具 :phpstorm, sublime, vim
mysql管理工具: phpmyadmin , navicate , mysql
postman
手机设备,外网服务环境
About ME
👋 读书城南,🤔
在未来面前,我们都是孩子~
📙
一个热衷于探索学习新方向、新事物的智能产品经理,闲暇时间喜欢coding💻、画图🎨、音乐🎵、学习ing~
👋 Social Media
🛠️ Blog: http://oceaneyes.top
⚡ PM导航: https://pmhub.oceangzy.top
☘️ CNBLOG: https://www.cnblogs.com/oceaneyes-gzy/
🌱 AI PRJ自己部署的一些算法demo: http://ai.oceangzy.top/
📫 Email: 1450136519@qq.com
💬 WeChat: OCEANGZY
💬 公众号: UncleJoker-GZY
👋 加入小组~
👋 感谢打赏~
...
php开发APP后端---学习序言
### 序言
梳理学习计划
1、后台登录功能详解
2、娱乐新闻内容管理
3、restful api
4、api数据安全解决方案
5、app-api
基础信息接口开发以及接口文档详解
6、app版本升级业务开发
7、登录、个人中心、点赞以及评论功能开发
8、app端异常、性能监控以及定位分析
9、打造app消息推送服务
### 功能分析
#### app - 版本升级 - 首页接口API - 栏目接口 - 栏目列表页数据接口 -
详情页接口 - 相关推荐 - 内容搜索 - 评论、点赞 - 登录功能 - 手机号+验证码
- 手机号+密码 - 个人中心 - 消息推送服务 - APP端异常分析定位
数据表ER关系总图
1550155519929
About ME
👋 读书城南,🤔
在未来面前,我们都是孩子~
📙
一个热衷于探索学习新方向、新事物的智能产品经理,闲暇时间喜欢coding💻、画图🎨、音乐🎵、学习ing~
👋 Social Media
🛠️ Blog: http://oceaneyes.top
⚡ PM导航: https://p ...
计算广告-知识储备
计算广告-知识储备
1、信息检索
1.1、倒排索引
核心目的,将从大量文档中查找包含某些词的文档集合,用O(1)的时间复杂度完成。
基本操作:
1、向索引中加入一个新文档
2、给定一个有多个关键词组成的查询时,返回对应的文档集合
1.2、向量空间模型
向量空间模型(Vector Space Model
,VSM),信息检索中最基础且最重要的文档相似度度量方法之一。
核心:
1、文档的表示方法
用各个关键词(term)在文档中强度组成的矢量来表示该文档
\[
D=(X_1,X_2,...X_m)^T
\]
2、相似度计算方法
2、最优化方法
2.1、下降单纯型法
2.2、梯度方法
2.3、拟牛顿方法
2.4、Trust-Region方法
2.5、带约束 优化和拉格朗日法
3、统计机器学习
3.1、最大熵原理
3.2、指数族分布
3.3、混合模型和EM算法
3.4、贝叶斯学习
3.5、共轭先验
3.6、经验贝叶斯
3.7、变分法
About ME
👋 读书城南,🤔
在未来面前,我们都是孩子~
📙
一个热衷于探索学习新方向、新事物的智能产品经理, ...
计算广告-基础
计算广告-基础
1、在线广告技术特点
技术和计算导向
数字媒体的特点使在线广告可以精细的用户定向
技术又使广告决策和交易朝着计算驱动的方向发展
效果的可衡量性
在同一个时期,点击率的绝对值并没有那么重要;而在一个特定时期不同广告和算法表现出来的差异,才更有
意义
创意和投放方式的标准化
标准化的驱动力来自受众定向与程序购买
需求方更关心的是受众人群,创意尺寸的统一化与数据接口的标准化就变得更加重要
媒体概念的多样化
数据驱动的投放决策
互联网化的根本驱动力是数据的深入加工和利用
2、计算广告的核心问题
计算广告的核心问题,是为一系列用户与环境的组合,找到最合适的广告投放策略以优化整体的投入产出比(ROI)
2.1、在线广告计费模式
CPM(Cost per Mile)
按照千次展示计费
CPC(Cost per Click)
按照点击计费
CPS(Cost per Sale)/ CPA(Cost per Action)/ROI
按照销售订单数、转化行为数或投入产出比来计费
情况一:需求方只按照最后的转化效益来结算
存在问题:
转化行为 ...
Data Management Platform 数据管理平台简介
Data Management Platform
数据管理平台
大数据在营销中的落地解决方案和实时消费者互动的基础
即:利用数据管理平台实现营销层面和战略层面的多重用途
DMP的三个层次,核心能力
数据整合能力
数据,即DMP的输入;
稳定可靠的数据来源是一切DMP的基础
建立DMP,可拿到大量非自己业务的数据,并且自己业务的数据可量化评估其他数据提供方的数据
对不同来源和不同结构的数据清洗 和整合
数据分析能力
用户画像是基础,即通过对用户信息的标签化,完美的抽象出一个用户信息全貌
用户画像的焦点:为用户打标签;一个标签 :高度提炼的特征标识
行业解决方案
DMP的输出
有了数据的整合分析,通过一个特定的应用场景,实现大数据的最终价值
即解决数据的最终如何变现的问题
DMP分类
按照数据归属
第一方数据
需求方即广告主,自有用户数据,包括网站/APP监测数据,CRM数据,电商交易数据等
第二方数据
需求方服务提供者,在广告投放过程中积累的业务数据,如DSP平台业务中积累的受众
浏览广告,点击广告等相关数据
第三方数据
非直接合作方拥有的数据,如运营商数据
...
CNN、RNN、DNN区别
CNN、RNN、DNN区别
img
神经网络起源
感知机(perception),包含输入层,输出层,和一个隐藏层;
输入的特征向量通过隐藏层变换达到输出层,由输出层得到分类结果。
多层感知机,多个隐藏层;
神经网络NN,使用连续函数模拟神经元对激励的响应,在训练算法上使用反向传播算法;
1、神经网络的层数直接决定了它对现实的刻画能力----利用每层更少的神经元拟合更加附加的函数。
2、神经网络层数加深,优化函数越容易陷入局部最优解,并且越来越偏离全局最优
3、利用有限的数据训练深层的网络,性能还不如浅层网络
4、网络层数的不断增加,“梯度消失”的现象更严重
DNN
2006年,Hition提出深度学习,利用预训练的方式缓解局部最优解问题,将隐藏层增加到了7层
CNN
卷积神经网络Convolutional Neural Networks
图像中存在固有的局部模式,故将图像处理和神经网络结合引出卷机神经网络CNN(Convolutional
Neural Networks),通过卷积核将上下层进行链接
因每层神经元的信号智能向上一层传播,样本的处理每个时刻独立,又被称为前向神 ...