字数统计的第二个例子涉及

Solve china dataset issues with shared expertise and innovation.
Post Reply
Bappy32
Posts: 598
Joined: Thu Jan 02, 2025 6:50 am

字数统计的第二个例子涉及

Post by Bappy32 »

2009 年国家花园鸟类统计打破了所有记录。参加人数超过两万,统计鸟类超过八十万只。获胜者是麻雀,其次是大山雀和黑鸟。关于鸟类和单词的数量,从家里到推特。

这些计数器做了什么?这些规则几乎没有留下任何想象空间:在 2009 年 1 月 24 日至 25 日的周末期间,花至少一小时数一下花园或阳台上的鸟类。在窗边找到一个可以看到整个花园或阳台的位置,手边准备好纸笔,可能还有观鸟指南和双筒望远镜,然后通过网站tuinvogeltelling.nl提交您的计数。

花园鸟类计数这是一种美丽、勤奋的公民参与形式,其结果是我们知道我们看到了哪些鸟。对于新闻报道或国家媒体头版的小文章来说,结果总是好的。

接受cookies
但现在我们继续前进。我们要数的不是鸟,而是单词。人们所使用的词语。在街上、在信件中、在谈话中。我们时代的一个特点是越来越多的语言,包括普通口语,都可以通过数字方式获得。

我举两个例子。

一个众所周知的现象是谷歌的时代精神。告诉我正在寻找什么词,我会告诉你世界的进展如何。如果将“危机”和“黄金”一词放在同一个图表中,您将看到您可能期望的结果:首先,“危机”一词出现峰值,几天后,“黄金”一词的搜索量明显增加为了。 。众所周知,甚至在第一批银行出现在博斯部长面前之前,“墙上保险箱”这个词的搜索量就越来越大。因此,在数字得到确认之前,对老式安全性的潜在需求就已经存在。

危机黄金因此建议您可以为 Google 输入统计数据分配一个预测值。这意味着授予谷歌的关键词集合仅仅代表金钱。这里有大量的内幕知识来源。
《纽约时报》最近在美式橄榄球决赛“超级碗”期 厄瓜多尔WhatsApp 数据 进行的实验。在红雀队和钢人队之间的这场比赛中,观众可以向网站发送短信。您可以通过时间轴(比赛的时间进程)和美国地图以图形方式显示此集合。对于每个州,您都可以看到比赛期间存在的情绪,这有一个令人兴奋的得分过程。但在这场决赛中,非常昂贵的广告的影响是什么,人们对鲍勃·迪伦的百事可乐广告的讨论程度如何,以及是否已经可以预测多力多滋广告将成为所有获胜者,这些都立即变得显而易见。广告。

推特闲聊

超级碗期间的 Twitter 聊天(点击图片查看可玩版本)

它们是字数统计的两个应用。它的使用仍然是无辜的,但具有挑战性的问题正在出现,甚至更具挑战性的答案。假设越来越多的语音将通过网络数字化。所有这些网络都可以被合法或非法地监听。使用笨拙的统计数据可以轻松回答这个问题。

哪些应用将成为可能?在选举前几天不再举行官方民意调查在多大程度上仍然有意义? “泄露”和“信息”这两个词还存在吗?趋势观察者的作用是什么?

如果每只鸟都被打上芯片,就像我们草地上的每头牛现在都有耳标一样,还会有国家鸟类计数吗?不,当然不是。鸟儿可没那么容易被削。我们自己通过输入文字来使用文字。假设很快就会有足够多的词语找到有意义和无意义、普通和危及生命的答案。

该专栏还发表在Het Financieele Dagblad上。
Post Reply