然而,平均每天 300 条消息并没有什么意义。有一些品牌经常被讨论,而绝大多数品牌的讨论较少。多达 71% 的信息都是关于前 20 个品牌的(见下图)。用数学术语来说,这意味着不存在具有代表性均值的正态分布。存在帕累托或“幂律”分布,其中一小部分品牌被不成比例地讨论。在本文后面我们将讨论这对品牌意味着什么。
与去年一样,NS 是社交媒体上讨论最多的话题。平均而言,我们每天谈论这个问题超过 2,300 次。其中,2 月份的冬季火车时刻表和国家铁路宣布将不再关注旅客意见的新闻最受关注。
ING 在信息数量方面位居第二。多次 DDoS 攻击所造成的中断导致了 ING 的评级居高不下。继 ING 之后,依次是 多米尼加共和国电报数据 lbert Heijn、三星和 KPN。这五大品牌在社交媒体上每天的讨论次数均超过 1000 次。
前 100 个品牌的消息数量趋势(顶部)和前 20 个品牌的消息数量趋势(底部)
前 100 个品牌的帖子数量(顶部)和前 20 个品牌的帖子数量(底部)的进展。
坎皮纳 (Campina) 获得最积极评价
根据先进的语言算法(来自 Teezir),每条消息都被确定为正面的、负面的或中性的。利用这些数据,我们计算出了每个品牌的情感分数。情绪分数是正面消息的百分比(与有关品牌的所有消息相比)减去负面消息的百分比。因此,负余额意味着负面消息多于正面消息。请参见下图以了解前 5 个正面品牌和前 5 个负面品牌的概览。