OCAEN.GZY读书城南

发表于2019-01-14|产品内容产品推荐

1 初期阶段个性化推荐不是产品首次发布就能自带的。无论是基于用户行为的个性化，还是基于内容相似度的个性化，都建立在大量的用户数和内容的基础上。产品发布之初，一般两遍的数据都有残缺，因此个性化推荐并不能完整开展。故，产品发展初期推荐内容一般采用更加聚合的“热度算法”，把热点的内容有限推荐给用户；虽无法做到基于兴趣和习惯为每一个用户做到准确化推荐，但能覆盖到大部分用户需求，而且启动成本比个性化推荐算法低很多。 2 热度算法 2.1 热度算法基本原理新闻热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分 Score = S0 + S(Users) – S(Time) 1、新闻入库后，被系统赋予一个初始热度值，该新闻进入推荐列表进行排序 2、随着新闻不断被用户点击阅读，收藏，分享...... 用户行为被视作帮助提升新闻热度，系统需要为每种新闻重新赋予热度值 3、同时，新闻自身具有较强的实效性，随着时间的变化而变的陈旧，进而热度衰减 2.2 初始热度需要不一致由于不同的新闻本身属性所在，受欢迎程度是不一样的。如：娱乐类比文化类受欢迎程度高；某 ...

用户体验地图

发表于2019-01-06|产品用户体验

概述用户体验地图（User Experience Map），也被叫 User/CustomerJourney Map，它是用户增长策略体系的一部分，是产品优化的重要工具。它从用户视角了解产品流程，可以帮助我们找到用户的痛点、发现产品存在问题的阶段，从而有的放矢地进行优化，因此它更适用于产品从1-∞的阶段（0-1阶段的产品的用户是虚拟的、数据是缺失的，因此整个体验地图可靠性低）。 img △ Crash-Course-CX 组成一个标准的用户体验地图一般包含以下三大组成部分：用户：用户画像（persona）、用户目标（user goals/needs）；用户和产品：用户行为（doing）、触点（touch point）、想法（thinking）、情绪曲线（feeling/experience）；产品机会：痛点（pain point）、机会点（opportunities）。 img △ 三大部分如下图，raileurope体验地图，它的时间比较早，但因为非常全面和标准，包含体验地图相关的所有要素，至今仍然被各大公司当作参照的模板。原版是英文，为了方便大家理解 ...

Python数据挖掘——概要

发表于2019-01-04|Artificial IntelligenceData Mining

一、数据挖掘过程 1.数据选择分析业务需求后，选择应用于需求业务相关的数据：业务原始数据、公开的数据集、也可通过爬虫采集网站结构化的数据。明确业务需求并选择好针对性的数据是数据挖掘的先决条件。 2.数据预处理通常选择好的数据会有噪音，不完整等缺陷，需要对数据进行清洗，缺失项处理，集成，转换以及归纳： python字符串处理（相当方便）、正则式匹配、pandas、beautifulsoup处理Html标签等等工具。 3.特征工程/数据转换根据选择的算法，对预处理好的数据提取特征，并转换为特定数据挖掘算法的分析模型。 4.数据挖掘使用选择好的数据挖掘算法对数据进行处理后得到信息。 5.解释与评价对数据挖掘后的信息加以分析解释，并应用于实际的工作领域。二、数据挖掘常用算法简介 1.关联分析算法关联规则在于找出具有最小支持度阈值和最小置信度阈值的不同域的数据之间的关联。在关联规则的分析算法研究中，算法的效率是核心的问题。经典的算法有：Apriori算法，AprioriTid算法，FP-growth算法； 2.分类算法决策树算法：以树形结构表示分类或者决策集合，产生规则或者发现 ...

常见的研究者认知偏误

发表于2019-01-02|小记

常见的研究者认知偏误前言：认知偏误（Cognitive bias）是一种常见的现象，它是指当我们思考问题或做决策时，大脑会有一些固定的思维倾向。这个过程多是无意识的，有时也会带来正面作用，如帮助我们在纷繁复杂的环境中节省思考时间，更高效地做出决定但是在研究中，认知偏误易导致研究结果不准确，降低研究的价值。我们都希望研究是客观、理性、反映真实情况的，了解常见的认知偏误可以帮助我们在工作中尽量规避它们，得出更准确的结论。实际上每个人都会有认知偏误，包括用户研究者和用户。今天我们就来说说研究者的常见认知偏误，下次有机会再谈谈用户的，敬请期待。一、确认偏误（Confirmation bias）当人们本来就持有某种观点时，对这种观点的感知和注意度会被放大，会选择性地回忆或收集关于它的事例。人们对于自己原本就相信的观点会更容易接受，而把反面观点搁置在一旁。举个例子：有些人认为女司机不擅长开车，更容易造成事故，所以当新闻中的事故与女司机有关时，他们会觉得“果然如此”。而实际上男司机的事故率比女司机更高。在用户研究中，当你的预设想法是用户对A设计的满意度比B设计更高时，在研究中你可能 ...

php开发APP后端---环境准备

发表于2019-01-02|php

环境和工具集成环境 phpstudy xampp mamp 工具 PHP开发工具：phpstorm, sublime, vim mysql管理工具： phpmyadmin , navicate , mysql postman 手机设备，外网服务环境 About ME 👋 读书城南，🤔 在未来面前，我们都是孩子～ 📙 一个热衷于探索学习新方向、新事物的智能产品经理，闲暇时间喜欢coding💻、画图🎨、音乐🎵、学习ing~ 👋 Social Media 🛠️ Blog: http://oceaneyes.top ⚡ PM导航: https://pmhub.oceangzy.top ☘️ CNBLOG: https://www.cnblogs.com/oceaneyes-gzy/ 🌱 AI PRJ自己部署的一些算法demo: http://ai.oceangzy.top/ 📫 Email: 1450136519@qq.com 💬 WeChat: OCEANGZY 💬 公众号: UncleJoker-GZY 👋 加入小组~ 👋 感谢打赏~ ...

php开发APP后端---学习序言

发表于2019-01-02|php

### 序言梳理学习计划 1、后台登录功能详解 2、娱乐新闻内容管理 3、restful api 4、api数据安全解决方案 5、app-api 基础信息接口开发以及接口文档详解 6、app版本升级业务开发 7、登录、个人中心、点赞以及评论功能开发 8、app端异常、性能监控以及定位分析 9、打造app消息推送服务 ### 功能分析 #### app - 版本升级 - 首页接口API - 栏目接口 - 栏目列表页数据接口 - 详情页接口 - 相关推荐 - 内容搜索 - 评论、点赞 - 登录功能 - 手机号+验证码 - 手机号+密码 - 个人中心 - 消息推送服务 - APP端异常分析定位数据表ER关系总图 1550155519929 About ME 👋 读书城南，🤔 在未来面前，我们都是孩子～ 📙 一个热衷于探索学习新方向、新事物的智能产品经理，闲暇时间喜欢coding💻、画图🎨、音乐🎵、学习ing~ 👋 Social Media 🛠️ Blog: http://oceaneyes.top ⚡ PM导航: https://p ...

计算广告-知识储备

发表于2019-01-02|广告产品计算广告

计算广告-知识储备 1、信息检索 1.1、倒排索引核心目的，将从大量文档中查找包含某些词的文档集合，用O(1)的时间复杂度完成。基本操作： 1、向索引中加入一个新文档 2、给定一个有多个关键词组成的查询时，返回对应的文档集合 1.2、向量空间模型向量空间模型（Vector Space Model ，VSM），信息检索中最基础且最重要的文档相似度度量方法之一。核心： 1、文档的表示方法用各个关键词（term）在文档中强度组成的矢量来表示该文档 \[ D=(X_1,X_2,...X_m)^T \] 2、相似度计算方法 2、最优化方法 2.1、下降单纯型法 2.2、梯度方法 2.3、拟牛顿方法 2.4、Trust-Region方法 2.5、带约束优化和拉格朗日法 3、统计机器学习 3.1、最大熵原理 3.2、指数族分布 3.3、混合模型和EM算法 3.4、贝叶斯学习 3.5、共轭先验 3.6、经验贝叶斯 3.7、变分法 About ME 👋 读书城南，🤔 在未来面前，我们都是孩子～ 📙 一个热衷于探索学习新方向、新事物的智能产品经理， ...

计算广告-基础

发表于2019-01-02|广告产品计算广告

计算广告-基础 1、在线广告技术特点技术和计算导向数字媒体的特点使在线广告可以精细的用户定向技术又使广告决策和交易朝着计算驱动的方向发展效果的可衡量性在同一个时期，点击率的绝对值并没有那么重要；而在一个特定时期不同广告和算法表现出来的差异，才更有意义创意和投放方式的标准化标准化的驱动力来自受众定向与程序购买需求方更关心的是受众人群，创意尺寸的统一化与数据接口的标准化就变得更加重要媒体概念的多样化数据驱动的投放决策互联网化的根本驱动力是数据的深入加工和利用 2、计算广告的核心问题计算广告的核心问题，是为一系列用户与环境的组合，找到最合适的广告投放策略以优化整体的投入产出比（ROI） 2.1、在线广告计费模式 CPM（Cost per Mile）按照千次展示计费 CPC（Cost per Click）按照点击计费 CPS（Cost per Sale）/ CPA（Cost per Action）/ROI 按照销售订单数、转化行为数或投入产出比来计费情况一：需求方只按照最后的转化效益来结算存在问题：转化行为 ...

Data Management Platform 数据管理平台简介

发表于2019-01-01|DMP

Data Management Platform 数据管理平台大数据在营销中的落地解决方案和实时消费者互动的基础即：利用数据管理平台实现营销层面和战略层面的多重用途 DMP的三个层次，核心能力数据整合能力数据，即DMP的输入；稳定可靠的数据来源是一切DMP的基础建立DMP，可拿到大量非自己业务的数据，并且自己业务的数据可量化评估其他数据提供方的数据对不同来源和不同结构的数据清洗和整合数据分析能力用户画像是基础，即通过对用户信息的标签化，完美的抽象出一个用户信息全貌用户画像的焦点：为用户打标签；一个标签：高度提炼的特征标识行业解决方案 DMP的输出有了数据的整合分析，通过一个特定的应用场景，实现大数据的最终价值即解决数据的最终如何变现的问题 DMP分类按照数据归属第一方数据需求方即广告主，自有用户数据，包括网站/APP监测数据，CRM数据，电商交易数据等第二方数据需求方服务提供者，在广告投放过程中积累的业务数据，如DSP平台业务中积累的受众浏览广告，点击广告等相关数据第三方数据非直接合作方拥有的数据，如运营商数据 ...

CNN、RNN、DNN区别

发表于2019-01-01|Artificial Intelligence神经网络

CNN、RNN、DNN区别 img 神经网络起源感知机（perception），包含输入层，输出层，和一个隐藏层；输入的特征向量通过隐藏层变换达到输出层，由输出层得到分类结果。多层感知机，多个隐藏层；神经网络NN，使用连续函数模拟神经元对激励的响应，在训练算法上使用反向传播算法； 1、神经网络的层数直接决定了它对现实的刻画能力----利用每层更少的神经元拟合更加附加的函数。 2、神经网络层数加深，优化函数越容易陷入局部最优解，并且越来越偏离全局最优 3、利用有限的数据训练深层的网络，性能还不如浅层网络 4、网络层数的不断增加，“梯度消失”的现象更严重 DNN 2006年，Hition提出深度学习，利用预训练的方式缓解局部最优解问题，将隐藏层增加到了7层 CNN 卷积神经网络Convolutional Neural Networks 图像中存在固有的局部模式，故将图像处理和神经网络结合引出卷机神经网络CNN（Convolutional Neural Networks），通过卷积核将上下层进行链接因每层神经元的信号智能向上一层传播，样本的处理每个时刻独立，又被称为前向神 ...