() 哈露米当然知道自己的同伴创造了那么一个玩意儿,卡雅倒是用一个很简单的称呼命名这个‘小玩意儿’──论坛索引。这个小玩意儿其实是一个建立目录的算法,它不储存资料,只整理资料。

建立起这套索引,不光可以选择时间序与地区,找出当时、当地最为热门或重大的事情。也可以针对关键词找到相关事件的关联、发生地点,针对名字找到其相关足迹、参与的事件。

不过一直以来,卡雅只注重在如何更正确地建立索引,如何更有效率地判断一段文章内容的关联。甚至引进了大贤者之塔曾用过的机器学习程序,那是用来针对目标,自动修正攻击参数的程序。而卡雅要研究的,就是让索引程序更聪明地自动判断关键与关联。

毕竟那套程序研发到现在,各种让人啼笑皆非的产出仍不时发生。而卡雅一直在做的事情,就是不断去完善判断逻辑,减少那些荒谬的错误。

再者有着最多且最完善资料的地区是西南半岛,其他的地区资料量和西南半岛那是相差了几个数量级。但是在半岛以外的地区会使用论坛,并且建立起有权限限制的私密区块,里头记载的事情,十件有九件是见不得人的。以每篇文章的情报价值来看,反而更高。

这也是哈露米找上卡雅帮忙的原因。

这是这件事情某人还不知道,两个少女跟他们的姊姊大人,也完没有意识到这是件多么夸张的事情。否则某人会要她们更谨慎,甚至喊停整个项目。至少不应该让人知道自己掌握有这样的工具,那么作为就应该要更加小心。

其实假如林真的知道的话,对这样的结果也会不感到意外。这跟史诺登帮cia建立的棱镜计划不太一样,那位大佬牛的地方是拦截网络上的封包,入侵、监控了所有连通网络的设备。整理资料使之变成有价值的情报,是最微不足道的一环。

数据分析,最困难的永远是如何取得数据的部分。剩下的就只是从资料中挖掘,找到自己想知道问题的答案。鉴于有些情报是有时效性的,所以数据挖掘这项工作不一定能慢吞吞地进行。

然而卡雅的as是一个漏洞百出的论坛。因为某人建立得早,加上服务器什么的,在最初根本没有其他人会,所以论坛成了迷地网络的唯一选择,所有信息都被放在这个筛子似的地方。少女的工作又没有期限限制,所以得到这样的成果,可以说是必然的。