微博将在算法挖掘基础上,引入编辑对违反有关法律法规的内容、社会负能量及过度娱乐化的信息进行人工干预。
作者 | 杨阳
1月底,国家互联网信息办公室指导北京市互联网信息办公室对微博负责人进行了约谈,要求后者整改传播炒作导向错误、低俗色情、民族歧视等违法违规有害信息的问题,当日微博即宣布将部分功能下线一周。
这些功能包括热搜榜、热门话题榜、微博问答功能、热门微博榜明星和情感版块、广场头条栏目情感版块等,下线时间从2018年1月27日21时至2月3日21时。
在下线的同时,微博也于近期通过微博管理员的账号密集公布了一些关于时政有害信息、违法信息涉黄信息、不实信息、用户纠纷和对垃圾账号的处理情况,上线了媒体辟谣平台。
上周末晚间,整改后的热搜、热门话题等功能恢复上线,微博平台的用户也能感受到新版本的“大不同”。
为此,微博副总裁曹增辉接受了界面新闻专访,详细讲述了此次热搜和热门话题整改的内容和措施,以及微博在平台内容上的监管方式。
界面:这次对热搜和热门话题的整改,主要集中在哪些方面?
曹增辉:过去热搜和话题榜的上榜机制,确实带给一些明星通过引导粉丝参与的方式去争取热搜曝光的机会,因此微博会控制榜单上明星娱乐内容的比例。
与此同时,微博会在榜单上展现更多社会正能量的信息,比如开设了新时代频道,主要为媒体及政府用户发布的正能量内容提供更好渠道,取得更好的传播效果。
这也可以确保相关榜单和话题能够更全面的反馈社会关注的热门内容。长期来看,对微博及热搜的健康发展是有益的。
界面:微博方面整改后,技术上会有怎样的调整?
曹增辉:这次调整的核心是引入了编辑人工干预的模式,微博会将算法挖掘作为基础,在排序和选择上放弃纯粹算法的方式,引入编辑对违反有关法律法规的内容、社会负能量的信息、过度娱乐化的信息进行人工干预。
微博已经单独设立内容编辑中心,整体负责热搜、热门话题,包括热门微博等曝光量较大的产品,对于全部上榜热词进行人工审核判断。
热搜、热门话题已经成为微博舆论场中的关注焦点,微博作为最有影响力的中文社交媒体平台,希望传递真实,多元化的信息,满足网民关注各个层面热点信息的需求,而不是像算法推荐平台一样单纯迎合网民娱乐猎奇的诉求。
界面:微博热搜、热门话题榜一直存在争议,尤其是刷榜和恶意营销问题,微博有对这些进行处理吗?
曹增辉:过去热门话题榜的处罚方式是惩戒刷榜主持人,这次整改后,微博基于热搜会建立更全面的对应惩戒机制。
热搜已从用户、行为、内容三方面构建防刷机制,主要根据可信用户的搜索行为进行统计,过滤刷榜营销用户和异常行为用户;在搜索行为上,会根据用户群分布、终端系统分布、搜索操作特征等维度来综合判定是否存在刷榜行为。例如,同一用户多次搜索同一Query只计入1次;短时间内频繁搜索的可疑用户不计入;搜索用户的访问终端来源分布不符合正常比例的不计入。
针对热搜刷榜行为,微博会视情节严重程度对相关账号会做功能限制、冻结、封停等处理,相关搜索词会被封禁3个月不上热搜榜单。
现在微博每天上榜的热词大约350个,系统拦截过滤的有390个左右。大家能在微博管理员账号看到刷榜行为的处罚公示,未来这个处罚机制会一直持续下去。
界面:我们发现处罚刷榜行为的公告里有这样一句话,“微博要求这些账号如果还想继续使用,需于当月底前,将刷榜所使用营销公司渠道,以及产生相关服务费用的发票、沟通对话记录等证据提供至站方邮箱以备核实,站方将酌情考虑解封事宜。”为什么会有这种酌情解封的处理?
曹增辉:刷榜现象的存在,主要还是由于市场有通过话题来进行传播的诉求。其实微博有健全的商业广告合作机制来帮助客户在微博上进行传播和宣传,当然也会清晰标注推荐和广告标识。
我们希望市场上有需求的合作方能够通过正当的途径和微博展开合作,而不是通过黑产渠道进行刷榜扰乱市场秩序的方式。
同时,微博也会一直对黑产刷榜行为进行打击,包括问题中提到的,通过收集黑产刷榜公司信息的方式,推动和配合主管部门和公安机关进行调查取证,希望能够通过法律手段维护互联网环境的健康清朗。
界面:微博平台上的信息量巨大,微博会进行一些内容安全上的把控吗?将从哪些方面进行投入?
曹增辉:微博在内容安全相关上的人力投入主要有几个方面。
一是对有传播影响力的账号进行管理,这是关键机制。现在微博有41.8万个月阅读量超过10万的头部用户,55个垂直领域都分别建立了专门的运营团队,去管理和沟通每个领域里的头部用户和机构。运营人员差不多有332人,现在考虑增加到600多人。
二是对热搜、热门话题、热门微博这种高曝光的热点区域内容加大人工干预审核力度。前面提到建立的内容编辑中心,现在也有50人了微博热点话题法律问题,也会再增加,差不多不低于100人。
三是微博有1100人的安全审核人员团队,对违法违规信息进行审核处理,多层复检,以后也会再增加到2000人左右微博热点话题法律问题,
最后还有微博监督员,我们公开招募网友组成站内自治组织,对站内涉黄信息进行举报,然后按月提供上网补贴和物质奖励。今年上半年将增加到2000人,低俗和违法信息也是他们监督的内容。
信息鉴别技术的研发力度也是我们的重点,现在内容审核相关研发人员有197人,未来技术人员还会增加10%左右。已有技术包括关键词检测系统、图片检测系统、违法信息模型检测、有害帐号特征库等。
比如说关键词,内容发布后,微博会先通过关键词系统进行检测,像有时政有害信息的内容就无法发布;还有图片,用户发布后,系统会自动进行比对相似度90%以上的系统直接处理,相似度50%-90%的就有人工审核;还有一些违反社区公约的账号,信用积分扣到一定程度,就会被禁止发微博和评论等等。
界面:微博如何对平台上的舆论进行引导?
曹增辉: 微博上的政府和传统媒体机构声量会越来越大,尤其是在热点事件发生之后。
现在,微博上认证的政务微博有17.3万,媒体微博3.3万,当中人民日报粉丝有5585万,央视新闻粉丝有5247万。
过去几年,微博也一直在让这些机构能更好地使用微博传播内容,比如在话题引导上,社会时政的话题都会优先给媒体微博来主持;去年微博还开放了评论管理功能,支持媒体微博、政务微博自己管理博文下面的评论,传递更为积极的讨论信息。
刚刚我们上线了媒体参与辟谣的功能,媒体可以直接给他们认定为不实信息的账号进行标记处理,之前,政务微博的辟谣已经起到了很好的效果。
当然,不足的地方是政务微博的基层渗透和活跃不够、该发声的时候失声,或者使用微博不够熟练,一些失误的操作反而带来新的舆情,我们会和他们保持合作和沟通,做好舆论引导工作。
界面:大家非常关注的色情低俗问题,微博是怎样鉴定和监控的?
曹增辉:微博一直积极配合主管部门打击色情低俗内容,主要还是通过系统和人工结合的方式。
技术上是用了阿里云的绿网识别平台,对色情内容的识别准确率能到95%,我们每天拦截处理的色情内容差不多6万多条。
上面也提到网友组成的微博监督员自治,由网友来举报方式处理涉黄信息,我们回报上网补贴和物质奖励,到去年12月,我们收到监督员们的涉黄信息举报有343.3万条,总体准确率达到99.67%,我们自己也有账号管理机制,尤其是管理一些传播能力强的用户,封杀低俗账号,已经累计封杀低俗头部帐号近3000个,其中此次整改集中清查封杀了1500多个。
现在看,微博上的色情内容已经得到控制,当然还有一些用户发布低俗擦边的内容,吸引用户进入其他互联网平台进行交易,这是一个难点,我们也在配合主管部门加强各个互联网平台之间的联动。
界面:微博上每天有大量的用户在进行信息交流,同时也会产生一些争吵和人身攻击,很多甚至违法,用户会因此退出微博平台,微博会对这些内容进行引导和监管吗?
曹增辉:微博很早以前就有社区公约,《新浪微博社区公约》和一些社区规则,我们也一直在完善这个体系。
你能看到微博平台上有举报功能,针对一些不实信息、人身攻击、冒充他人、泄露隐私、抄袭信息等用违规内容进行处置,另外我们也用大数据和人工智能系统和机制,对人身攻击进行全站屏蔽和拦截。
那像不实信息的治理,我们很早也上线了不实信息举报功能,开通了微博官方辟谣账号@微博辟谣,以及前面我们提到刚上线的媒体辟谣平台等,都是能直接参与微博平台共治的。
·END·