服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

是否了解算法推荐系统的两个核心,决定运营人的月薪

2020-11-13 16:35:30 阅读(185 评论(0)

1、在纸媒时代,消费者在获取信息和内容方面处于非常被动和稀缺的状态。虽然报纸和杂志是“千人一面”,但很多人还是放不下,看了又看。随着互联网时代(尤其是移动互联网)的到来,信息呈现出“信息爆炸”的状态,就像“三体”中的“技术爆炸”概念一样。互联网的每一个角落都诞生了以EB为单位的每日信息量,预计2025年全球每日产生的数据量将达到491EB(1EB=1024PB=1048576TB)。在这种情况下,消费者对获取信息变得更加积极和丰富——但丰富并不意味着有效。纸媒时代也有专业的编辑筛选内容,排版后“分发”给消费者。但对于互联网产品来说,即使内容丰富,用户也不感兴趣。要知道“效率”是商业社会的本质之一。低效意味着随时可能落后或被淘汰。为了解决这个问题,淘宝首先在2013年提出了“千人千面”的概念。依托淘宝十年发展积累的庞大数据库,从细分类别中抓取与买家兴趣相匹配的商品,优先展示。每个在淘宝网上购买或浏览商品的消费者都会被平台贴上标签,如年龄、地区、客户单价、收藏偏好等。不同的标签,用户在千人千面模式下看到的产品会有所不同。更有效的内容分发方式,从野蛮成长到精细操作的时代。在以“算法驱动”为核心的张一鸣手中,今日头条、抖音等产品是在“算法驱动”理念下饲养的洪水猛兽。如今,算法分发几乎是所有搜索引擎、浏览器、信息软件、内容社区、社交软件等产品的标准配置。例如,在阿里巴巴内容运营专家的社会招聘岗位上,需要联动内容制作和算法上下游进行相应的战略实施:运营专家的水平基本上从P7开始,年薪为50W:因此,作为一名运营商,即使你不需要写编程算法,了解相关算法知识和相关推荐机制背后的原则是成长和进步道路上必须点亮的技能点之一。2、算法推荐系统的两个核心:内容标签和用户标签算法的原理本质上可以用一句白话来解释:让喜欢看女孩的用户看到包含女孩的内容。但在现实环境中,纵观互联网,很少有公司能把这句话做好。为什么抖音如此上瘾?很多人可能会有这样的经历:在不同的场景下(在家、地铁、公司)、即使是同类型的内容(如电影),在不同的时间点(早上、中午、晚上)实际上收到的内容也略有不同。比如白天大部分都会收到幽默的内容,晚上会收到略带悬念的影视剪辑片段等。;无论何时打开抖音,用户都可以沉浸其中,似乎感觉不到时间的流逝,往往一两个小时就能突然过去。你会发现抖音似乎很了解你,因为你喜欢看所有的内容。除了抖音的产品设计、身临其境的消费体验、短而快的内容节奏外,它还涉及算法推荐机制和操作策略。2.标记内容真的那么简单吗?很难定义标签,也很难标记内容。在给内容贴上标签之前,首先要做的就是定义标签。也就是说,说清楚苹果是什么,而不是叫苹果梨。一个内容通常包括几个层次:一级分类、二级分类、三级分类和标签。如动漫>日漫>火影忍者>鸣人更容易定义这些具有普遍认知的分类和标签。但对于搞笑、美女这样的标签,通常因人而异,因为每个人的笑点不同,审美观也不同。到底什么内容才算好笑,多美才算美女?萝卜和蔬菜各有所爱。在标记开始之前,它们首先被卡在定义上。事实上,它们涉及两个概念——物理标签和语义标签:1)物理标签广州是广州,上海是上海;马云是马云,淘宝是淘宝。它们都是确定的实体,通常不会对不同的人产生太大的歧义。2)沙雕、美女、奇葩等语义标签没有明确的指定对象,不同的人会有不同的认知。因此,语义标签的定义通常会出现标记困难。语义标签的推荐效果是测试公司NLP(自然语言处理)技术水平的试金石。根据不同公司的业务能力或业务需求,对标签粒度的要求也有所不同。例如,一些公司不拆除火影忍者,直接将这个词作为最小粒度的标签;所有涉及动画的内容都可以贴上“火影忍者”的标签,但不可避免地会有一种一刀切的感觉,这也会对后续的操作产生影响。例如,一些用户想看或搜索“火影忍者”。结果,所有的“火影忍者”都被推送和搜索;一些公司继续拆除:火影忍者>鸣人、佐助、樱花等实体标签。所以可以看出,标签粒度越细,推荐内容越准确,需要投入的资源越多。OK,即使整个公司的招标团队被拉进会议室,通过统一的培训和解释,一个月后,我们终于对什么是沙雕和什么是美有了统一的认识,审美也逐渐相同。那么打标能顺利进行吗?NO!让我们慢慢喝口水,然后继续说话。(3)用户标签:可能是最难的部分。1.用户的口味就像一个比内容标签更难哄的女朋友,因为火影忍者就是火影忍者,一旦贴上这个内容标签,就不会成为海盗王。内容标签可以手工标记 进行机器训练。不同的用户,也许这个月他喜欢看火影忍者,算法推荐机制也为他匹配了相关内容。但下个月,由于朋友和同事的推荐,他可能会开始阅读《海盗王》。如果算法没有反应,他将继续向他推送火影忍者的相关内容。此时,这些内容对他来说是无效的,从而影响了内容的分发效率。例如,胡萝卜一直是胡萝卜,但用户的口味一直在变化。今天想喝汤,明天想吃肉。事实上,如果你不小心点击了几篇文章,算法默认你喜欢这类内容,然后你一直在推送相关信息,不能根据用户的口味变化灵活更改。虽然在这个时代,无论使用哪种内容产品,“信息茧”现象都是不可避免的,但成熟的NLP技术和初级技术之间的实际产品体验效果仍然非常不同。2.掌握用户的基本信息。在制作用户标签之前,您需要掌握与用户相关的信息,通常包括性别、年龄、地点、兴趣偏好等:性别有助于分发明显的性别属性:如向男孩推动运动,向女孩推动美容和皮肤护理;同样的年龄:向年轻人推动动画、游戏和其他内容,向老年人推送健康和保健信息;该地点用于推送与区域热点相关的信息:例如,向上海用户推送上海紧急新闻和北京限制似乎对广州用户影响不大。以上三种信息通常可以通过用户自动填写和授权访问位置信息获得,不会有太大变化。以上三种信息通常可以通过用户自动填写和授权访问位置信息获得,不会有太大变化。对于用户的兴趣偏好,如上所述,这是制作用户标签的困难。获取用户兴趣偏好的方式是根据用户消费的内容匹配相应的标签,通常采用以下方式定位:过滤噪声:如果用户被标题派对内容吸引,但停留时间过长,用户对内容绑定的标签不感兴趣,过滤标题派对;热点减少:对于一些社会热点,紧急新闻(如明星欺骗),虽然用户在短时间内浏览相关信息,然而,这并不意味着用户必须对“娱乐”内容特别感兴趣,需要减少用户的“娱乐”兴趣偏好;时间衰减:如上所述,用户的兴趣会发生偏差,因此推送策略需要更倾向于新的用户行为;惩罚显示:如果不点击推荐给用户的文章,则内容的相关特征(如内容分类和标签)权重将降低。比如新注册用户(女,28岁,上海)在刷抖音的时候会用A-A、A-测试B的方法。比如新注册用户(女,28岁,上海)在刷抖音的时候会用A-A、A-测试B的方法。首先,连续推送两个影视剪辑内容(A-A),用户观看完整,有点赞、评论等操作;其次,推送影视剪辑后,推送母婴内容;(A-B),用户只看电影和电视剪辑内容,却划掉了母婴内容。这说明用户对“影视剪辑”内容的兴趣偏好较高,对“母婴”标签内容的兴趣偏好较低。3.我们都知道,对于综合平台,通常有不止一种内容。今天的头条新闻包括几种不同形式的内容,如长图形、小视频、短视频、问答和微标题。即使是同一个标签,比如“美女”,不同内容类型的推荐权重是否相同?还是给经常看小视频的用户推送相关内容?这也是算法推荐机制需要考虑的问题。不同的产品形式对内容类型有不同的推荐权重。例如,B站主页上短视频的推荐权重通常高于小视频。三、如何衡量推荐系统内容推荐的准确性,通常可以直接从数据上进行分析。CTR(点击率)、“可量化指标”,如Y消费时间、喜欢、评论、转发等。=F(X1、X2、X3)由于产品差异,评论数的影响权重通常大于赞扬权重,不同平台对参数的权重设置也不同。不同的用户即使赞同一个内容,也会因为账号的“可信度”而对内容产生不同的影响:比如知乎大V赞和普通账号赞明显不一样。但有时数据也有缺陷,如粗俗、标题派对、黄色内容,如果时间吸引了大量用户点击浏览,那么算法能判断它是好内容,增加推送量吗?——答案显然是否定的。通常需要压制降权的内容主要有以下几种:广告、低质量处理内容压制;黄色、粗俗、恶心的内容压制;标题党、低质量账户内容降权等。因此,基于社会责任感、政策法规等因素,有必要抑制和减少这部分内容的权利,并插入关键时事新闻。例如,当你打开新闻应用程序时,你会看到习大的相关文章。这些都是算法无法独立完成的,需要操作配合。很多信息平台都会有专门的主页运营团队人工干预内容。很多APP日常通知栏PUSH的内容也采用算法 人工推送。四、总结回到开头说:让喜欢看姐姐的用户看到包含姐姐的内容。这句话如此简单,要实现它,我们需要做到:1。内容标签的准确定义和标记,因为不同的人会对同一语义标签有不同的理解。2.准确匹配用户标签,清楚用户对哪种“女孩”更感兴趣:长发女孩?还是短发女孩?是双眼皮?还是单眼皮?南方人或北方人等粒度较细的拆分。用户标签是基于内容标签足够准确的前提条件,一步一步错误。若内容标签无法准确判断,则基于内容标签的用户标签也是不可信的。3.算法训练要想训练机器自动打标,通常需要几周的时间来训练一个“标签”。内容标签通常是通过抓取标题关键词来标记的,但有时标题与文章或视频中表达的所有内容都有很大的不同。因此,标签可能不准确,需要手动审查以确定其准确性。4.即使内容标签和用户标签都准确,算法训练也足够牛X,内容是否足够?这是另一种灵魂折磨。比如很多用户喜欢看“长发、双眼皮、南方女生”的相关内容,但是“内容库”里这种类型的内容并不多,推了几个就开始反复推,用户看腻了。此时,操作策略需要配合算法进行相应的调整和内容介绍和扩展。光看上面这些就已经让人头大了,但还没有结束:谁是上游相应的内容制作人?满足供应需要生产多少内容?新内容对其他类别的现有内容有什么影响?不同层次的内容创作者应该如何分享利润?以及如何优化生产、仓储、审核、标记、分发各个环节的内容损坏?这些都是运营商在实际工作中需要不断探索和探索的问题。 

内容来源:人人都是产品经理,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

天猫双十一促销策略?

2021年双十一期间天猫和淘宝的营销策略?2021年双11期间天猫和淘宝营销策略,2021年双11,天猫和淘宝的策略就是满多少减多少,非常划算,跨店可以满减,只要跨店购买都可以,都有满减的优惠券在给你进行优惠活动,所以非常划算,这个期间购买…查看详情

如何做好网络推广?这7点非常重要!效果惊人

为了做好网络推广工作,我们必须提前构思好推广的思路。良好的网络推广思路将直接影响到后期推广的效果。今天,就和大家讲一讲如何做网络推广。图片来源于网络第一:分析自身及其竞争对手的网络营销现状 √知已知彼,百战不殆。在进行任何网络营销推广方案…查看详情

淘宝代销怎么操作?如何做好淘宝代销?

  优质答案(1)  借助淘宝分销平台 淘宝分销平台也可以说是一个专业的产品代销平台,在这上面也会有很多的的商品供应商,因此在这样的平台上面的大部分商家应该也都会有这方面的一些需求的,所以在这样的条件之下,那么我们也可以进入这样的一个平台…查看详情

sqlserver是什么意思

什么是sqlserver?SQLServer是微软公司开发的关系型数据库管理系统(RDBMS),属于商业软件。它提供了一种安全、可靠、高效的数据存储和管理方案,并支持复杂的数据查询、处理和分析等功能。SQLServer具有多种版本和不同的功…查看详情

个人域名备案流程详细,域名备案多久备案一次

网站建设首先应该要选择域名注册,选择好域名之后还应该进行网站备案,这样才能够让网站更好的运营。其实不管是企业检查还是个人检查都是需要注意一些相关事项的,比如说网站域名之后应该要及时进行备案,还应该要了解相关的流程。接下来就一起详…查看详情

免费的搜题软件有哪些 搜题软件排行榜

我们在上学的过程中,会遇到很多难题无法解决,那么,除了上课可以问老师以外,还可以直接在软件里面查找难题的解答,这样的话也不需要问老师了,那么,搜题软件排行榜有什么? 1、上学吧搜题app 是一款专门为孩子作业而构建的辅助工具…查看详情

相册制作软件 制作相册的软件哪个好

  电子相册顾名思义指的是区别于传统相册,以电子媒介为载体,通过图、文、声、像并茂的表现方式来呈现及保持影像图片,如何制作电子相册?下面万商云集小编就为大家分享免费的相册制作软件。  制作电子相册只需一个简单实用的制作工具即可轻松搞定,这里…查看详情

茶百道加盟费大概要多少

  茶百道是一家以茶饮、甜品和小吃为主的连锁加盟品牌。其产品以选用新鲜健康、口感美味和配料丰富等特点受到消费者的喜爱,加盟茶百道的门店也在全国各地遍布,成为了一个受到广泛关注的品牌。如果你想要加盟茶百道,那么就需要了解一下加盟费用的具体情况…查看详情

想要减少人工成本费,可以看看下面这些资源管理软件

如今的社会,无论是哪个行业竞争压力都比较大,想要自己经营一家公司是特别困难的,因为成本费和人工费就特别多,那么,如果想要减少人工费,就要看一下资源管理软件有哪些? 1、ABCommander ABCommander是一款双界…查看详情

从提交申请到拿到注册证书,商标的注册时间共多久?

申请注册商标并非是一件容易的事情,很多时候会因各种各样的原因被驳回,而等到商标管理局作出予以注册的批准也需要一段时间。那么商标的注册时间一般要多久呢? 图片来源于网络 申请商标需要经过以下步骤:提交商标注册申请所需提交的资料——受理商标注册…查看详情

基础内容介绍 | 商标好注册吗?

商标好注册吗?相信这是大多想要注册商标或准备注册商标的企业和个人都想知道的问题。商标是否好注册,我们可以从它的注册要求、所需资料、申请流程、审核时间等方面来进行判断,不妨接着往下看。图片来源于网络 ▍ 商标好注册吗?从它的注册要求来看:通…查看详情

一套OA系统多少钱?有哪些购买注意事项?

目前越来越多的中小企业希望将业务生产、人员管理标准流程化,往往都需要采购一套OA系统来保障公司流程流转顺畅。而一套OA系统多少钱是很多企业老板最关注的问题,目前市场上OA系统的价格并不是标准化的,从几百元到几万元的OA系统都是有的,如果涉及…查看详情

如何查看windows版本

怎么查看电脑版本?步骤如下: 1、打开电脑,点击电脑左下角的开始菜单,在弹出的菜单选项中找到【控制面板】,单击进入控制面板界面。 2、打开控制面板后,界面的左上角有【系统和安全】选择项,鼠标单击进入该界面。 3、进入系统和…查看详情

mvc模式是什么意思

MVc模式的基本工作原理是基于观察者模式实现是基于什么模式?MVC是一种软件开发架构,它包含了很多的设计模式,最为密切是以下三种:Observer(观察者模式),Composite(组合模式)和Strategy(策略模式)。MVC最初是在S…查看详情

做思维导图的软件,免费思维导图制作软件

想要自己的照片更加生动,更吸引人一些,就需要借助一些软件去修,修出来的照片和原照片是完全不一样的,那么,首先我们要了解做思维导图的软件,免费思维导图制作软件 都有什么,然后才可以修。 1、博思白板BoardMix 这个软件是…查看详情

最新文章