关键绩效指标 (KPI) 是什么以及如何使用 KPI
目标: 预测任何潜在问题(盈余/短缺)。要查看您的现金流前景,用预计的全部总收入减去所有的支出和成本。这种预测可以以每年、每周或每月为单位。及早发现现金流问题可以让您进行任何必要的调整,并且这对于税收计划和商业贷款申请也很有意义。如果您想将很久之前的现金流与当前的现金流进行对比,例如,对比 2005 年和 2019 年的现金流,那么您可以使用实际的现金流对比某个特定时期的现金流,但要根据通货膨胀进行调整。
收入增长率
目标:深入了解您的创业发展速度。 它也用于观察和预测业务趋势。收入增长率将某个时期的当前总收入与上一个时期(季度对季度、年度对年度)的总收入进行比较。假设您在 2018 年赚了 10 万美元,在 2019 年赚了 25 万美元。
要计算年收入增长率,请用 2019 年的收入减去 2018 年的收入。然后将该数字除以 2018 年的收入再乘以 100,那么您的增长率将是 150%。
($250000 – $100,000) / $100,000 x 100 = 150
网站流量指标
目标: 衡量您网站的成功与否 。了解网站的内容主旨是至关重要的事情,毕竟它代表着您的企业形象。使用指标可以让您更好地了解访客体验以及访客数量:
- 月流量和年流量。 年同比 (YoY) 和月同比 (基于这个指标的策略效果更好 MoM) 的数字显示了每个时间范围之间的变化。哪些行为对您的流量有积极影响,哪些行为又有负面影响呢?
- 新访客和回头客。 这个统计数据是表示您的内容吸引用户群程度的一个指标。这会让更多访客变成回头客吗?
- 渠道共享。 每个渠道分别占的总流量百分比是多少?了解网站的流量渠道可以帮助您识别优势和劣势 – 特别是在推出新产品时,可以取长补短,充分利用您的资产。
- 网页平均浏览时间。这一衡量指标表明用户对您网页内容的消化程度。
- 转化率。 根据内容的类型,转换率可能是最强大的 KPI 之一。它衡量的是访客转变成实际用户的百分比。例如,您的网站一个月有 300 名访问者;他们中有 30 个人购买了您的商品。那您的转化率是 30 除以 300,即 10%。
搜索引擎优化 (基于这个指标的策略效果更好 SEO)/自然搜索流量
目标: 了解是否有人能发现您的网站。 当人们在线搜索产品或服务时,您的公司会出现在搜索结果中吗? 如果是,之后会发生什么?您可以通过以下 KPI 数据洞察结果:
- 自然搜索流量。 这个数字显示了有多少访客通过谷歌 (Google) 和必应 (Bing) 这样的搜索引擎访问您的网站。在大多数情况下,此数字越大越好。
- 页面权威性。 想要在 搜索引擎结果页面 (SERP) 中排名更高吗?这个 SEO 分数是表示您的页面排名情况的一个清晰指标。使用这个指标您可以将特定网页与自己网站上的网页或者其他域上的网页进行比较。
- 每个关键字的转化率。 即使您的网页有很高的点击率,这并不意味着这些访问量会推动转化率(参阅上述有关转化率的介绍)。如果转化率低,这可能表明您需要更多吸引人的内容或者搜索引擎使用了错误关键字进行了排名。
付费数字营销
目标:潜在顾客开发。吸引新客户(开发潜在客户)的方法之一是通过付费广告活动。以下是一些用于跟踪和量化优质潜在客户的常见 KPI:
- 按潜在客户收费 (CPL)基于这个指标的策略效果更好 : 您获取一位潜在客户的成本是多少?这是优质潜在客户吗?这样合理吗,还是您应该考虑改变现状?
- 按转化量收费 (CPC): 按转换量收费应该比按潜在客户收费的成本高一点,但是前者应该可以验证您的投资回报率 (ROI)。
- 转化时间: 您的考量周期有多长?此间隔应基于您所在的行业和分项成本。消费者转化周期通常较短,因为其成本不像商业产品那样高。
- 保留率: 您的转化客户或用户中有多少是回头客?
- 按实际效果付费 (CPA) 对于您了解付费广告是否提供了良好的投资回报率是不可或缺的指标。
- 点击率 (CTR) 是指看到您的广告(曝光)并点击它们的访客所占百分比。您可以用此指标来了解您的 SERP 和形象的表现。在查看 CTR 时,应该考虑的其他事项是位置和排名。最上面的排位通常点击率越高,但它的成本也最高。您需要在提高点击率和预算之间找到平衡点。这就是 CPA 发挥作用的地方。
目标: 品牌意识。您需要客户将一个优质的产品或服务与您的品牌联系起来。但是您如何获悉是否已达成这一目标呢?以下是企业衡量它的一些方法:
- 品牌内容参与度:查看页面上的时间、点击率、视频分钟数或特定的吸引人的内容。
- 搜索条目: 随着时间的推移,您可以看到 搜索品牌条目的数量增加情况。
- 倾听:一些 KPI 包括积极/消极情绪。
最后一点:一图胜千言。衡量 KPI 时,尝试使用彩图、图表或图像形式 可视化数据 以此获得全方位 360 度视图。您将更好地理解每个 KPI 的表现情况,以及它如何与您的整体营销和活动目标相一致。
基于这个指标的策略效果更好
量化CTA策略介绍
目前国内CTA的投资范围还是股指期货及期权、 大宗商品 期货和 国债 期货。至于投资策略,我们会用机器学习的手段做模式识别,从而给出价格预测。
期望收益=胜率×盈亏比(赔率)
最后,我们认为对CTA而言分散化是最好的风控手段。我们的实盘经验支持“分散化是 金融 市场中唯一免费的午餐”这一说法,也就是说分散化可以在不引入额外风险的前提下增厚我们的收益。所以我们在实际投资时,一直秉持交易品种的分散化、策略持仓周期的分散化,和交易信号产生逻辑的分散化。
Step 1:因子挖掘
Step 2:因子筛选
Step 3:机器学习
Step 4:交易决策
传统来说,因子挖掘主要由投资经理根据自己的交易经验和逻辑来手工完成,人工挖掘得到的因子因为具有较强逻辑性,因此往往可以在较长时间内都保持有效。但缺点是因子挖掘的周期较长,并且这两年随着各家机构研究的不断深入,人工挖掘因子的效率不断降低。所以我们在传统的人工因子挖掘外引入了遗传规划,由算法自动对因子进行挖掘。算法挖掘因子的优势是可以依托 计算机 的强大算力,因子挖掘效率非常高,但缺点是由于因子的逻辑性较弱,所以需要定期的迭代更新来维持因子的有效性。
基于这个指标的策略效果更好
1. 背景简介
2. 名词解释
3. 项目目标
4. 业界方案
5. 技术方案介绍
3)相关类目分析:根据线上user-cate购买行为,通过Association Rule Mining挖掘相关类目,使用confidence指标筛选类目并作为相关分,然后经过类目关系的二度扩散得到最终相关类目结果。类目扩散公式如下,其中表示类目k:
b) 将user-item表示为二部图,基于graph embedding方法生成用户向量。
PredictTA TopNPrecision指标由此而来,表示优选的TopN人群中品牌目标人群的占比,该指标越大说明模型预测效果越好。我们通过对比该指标在不同模型上使用不同topN值的值,验证了它的一致性;并设计NewTA topN Recall指标,即优选人群在之后一段时间品牌新增目标人群的占比,验证了它的正确性。
上图中,紫色框表示品牌目标人群即种子人群,蓝色框表示模型优选出的TopN人群,它与种子人群有小部分交集,交集占蓝色框的比例即为PredictTATopN Precision。绿色框表示一周内品牌实际新增人群,与蓝色框的交集为预测准确的人群,交集占绿色框的比例即为NewTA topN Recall。
对于有效的算法模型,PredictTATopN Precision指标随着TopN的减小而增大。两个不同的算法模型,PredictTA TopN Precision指标在不同TopN取值上的表现是一致的,说明该指标的稳定性。以A品牌为例,其一致性验证结果如下图所示:
b. 负样本选择:默认从全网其它品牌的人群中随机采样,但发现全网人群中特征缺失的情况比较多,负样本集离扩散人群比较远,因此实验了从全网其它品牌的已购人群中采样,PredictTA TopN Precision(N=300万)指标绝对值有0.8%的提升。
e. 稀疏特征embedding。对于类目id,品牌id这种高维高稀疏性的特征,直接将其作为分类模型的特征会影响最终的模型效果,为此,我们借鉴word embedding的思路,将用户过去一段时间内对类目(或品牌)的行为序列作为doc,将类目(或品牌)本身作为word,基于全网活跃用户的行为序列(doc集合)训练类目(或品牌)的embedding表示。具体而言,我们将类目(或品牌)编码为100维的低维稠密向量,并将其作为预测特征用于模型训练。
f. 特征选择。首先使用全部特征进行模型训练,然后根据特征重要性程度筛除部分尾部特征,重新训练模型,通过比较模型的PredictTA TopN Precision指标确定此次特征选择是否更好。
基于这个指标的策略效果更好
算法问题定义——即时兴趣强化
随着深度学习技术在多个领域的普及以及向量检索技术的兴起,一系列基于类似思想的深度学习召回技术相继涌现。Youtube在2016年提出了DNN在推荐系统做召回的思路,它将用户历史行为和用户画像信息相结合,极大地提升了匹配范围的个性化和丰富性。我们的工作基于同组师兄的召回工作《SDM: 基于这个指标的策略效果更好 基于用户行为序列建模的深度召回》,《User-based Sequential Deep Match》 也是这一思路的一脉相承。SDM能够很好地建模用户兴趣的动态变化,并且能够综合长短期行为在不同维度进行用户表征,从而更好的使用低维向量表达用户和商品,最终借助大规模向量检索技术完成深度召回。SDM上线较base(多路i2i召回merge)ipv指标提升了2.80%。较SDM模型,CIDM模型IPV提升4.69%。在此基础上,为了契合详情页分发场景的特点,我们丰富并挖掘了主商品相关信息,并将其作为即时兴趣对召回模型进行结构改良。
模型——CIDM(Current Intention Reinforce Deep Match )
- Trigger-Layer: 启发于论文1,对主商品显式建模: 除SDM中建模用户长、短期偏好之外,引入用户即时偏好层将主商品特征与长短期偏好融合作为用户最终表达;
- Trigger-Attention: 即将原模型中使用的self-attention改为由trigger作为目标的target-attention;
- Trigger-Lstm:借鉴论文2中的建模思路,我们将lstm的结构中引入了trigger信息,并添加trigger-gate让lstm倾向于记住更多关于主商品的内容;
- Trigger-filter-sequence:实验发现,使用主商品的叶子类目,一级类目过滤得到的序列作为原序列的补充进行召回建模,能够增加收益,故在数据源中添加了cate-filter-seq以及cat1-filter-sequece。
- 将trigger信息作为记忆门的一路输入,即通过sigmoid函数后与之前想要更新的信息相乘;
- 平行于第一个记忆门,添加一个新的即时兴趣门,其输入为细胞输入以及当前主商品,和记忆门结构一致。
变分自编码机是具有对偶结构(包括编码器和解码器)联合训练的系列模型,它借鉴变分推断的思路,在隐变量空间进行个性化定制,比较契合我们即使兴趣建模的需求。首先我们有一批数据样本 ,其似然分布可以表示为 ,最大化其对数似然时后验概率分布 是不可知的,因而VAEs用自定义分布 来近似真实的后验概率 计算,使用KL散度作为两个分布的相似程度的度量。整体的优化函数可以表示为:
具体推导可以参见论文5。其中第一项作为使假设的后验分布 和先验分布 尽量接近,第二项为重构损失,保证自编码结构整体的稳定性。其中,先验分布 是我们自定义的,这里想要将主商品的信息融入其中,因而我们假设 ,即使用主商品的表示作为高斯分布的均值,采样batch的二阶矩作为高斯分布的方差带入其中。因此,模型的优化函数变为:
精排模型基于DIN(Deep Interest Networks)进行探索与发展,我们的想法是在序列信息基础之上融入主商品更多的信息。序列信息挖掘和主商品信息强化其实是我们场景两个需求的外化,主商品信息强化能够很好地抓住用户即时意图,满足用户即时的聚焦需求;而序列信息挖掘是基于当前意图的延伸,能够一定程度上对意图进行发散,使推荐结果不会产生过于集中而带来体验疲劳。当然这两方面需要权衡,让模型识别其中“聚”,“散”的时机与程度。在此基础上,我们进行了1、挖掘主商品更多的语义信息;2、强化主商品信息对于序列特征抽取的指引与影响。
精排模型——DTIN(Deep Trigger-based Interest Network)基于这个指标的策略效果更好 基于这个指标的策略效果更好
其次,由于DIN的motivation是引入注意力机制来更精准的捕获用户的兴趣点,作为比待打分商品更强的用户兴趣点体现,我们设计了一个双attention结构来强化这部分信息。如图所示,首先,将trigger和candidate商品特征concat,传入第一层attention结构中,学得第一层加权向量 。这部分权值融合了trigger和candidate的信息,它可以被看作基于主商品及待打分商品交叉的用户兴趣提取。然后,仅使用主商品信息作为查询query传入第二层attention结构中,学得第二层加权向量 ,它可以被看作仅基于即时兴趣的延伸兴趣捕获。之后这两个权重向量按位相乘作为序列加权向量。模型结构设计这部分经历了大量的探索实验,如果有兴趣欢迎大家一起来讨论,这里只呈现我们实验中效果最佳版本。