第五十八章 随机取样
英雄联盟之真人秀 | 作者:葡萄籽 | 更新时间:2017-03-13 00:26:02
推荐阅读:
尼傲伸出拳头在空中狠狠地挥了两下,稳定了下情绪,又重新坐了下来。可是却发现自己敲打键盘的手指都还是在微微的着,他告诉自己越是在这样关键的时候,越需要冷静。可是一连数次不是敲击键盘敲错了键,就是选字的时候按错了字,连回上一句话都要停顿上好几次,一星半点往日下指如飞,号称可以同时和十个妹妹领不带停顿的“Q神”风采。这种在他正常的时候是很难以想象的场景,此时此刻,无疑就成为他鞋极端紧张的最好明证。
其实尼傲费了很大力气才写完、发送的问题很简单:“如果你的假设是对的,那么视觉通道之所以不通畅,是因为大量的信息拥挤堵塞造成的,那么我们的着眼点岂不是还是应该放在视觉刺激上吗?只要对这些拥堵作出了妥善的疏导,若山就可以顺利连接进游戏了,对吗?”
“bingo,理解正确,加十分。”“乔老师”对于尼傲的理解立刻给予了肯定。
“可是,我现在应该怎么办呢?我已经把我所知道的,若山最喜欢和最熟悉的东西(我肯定对象选择不会有错),都分别拿来做过试验了。可是看起来好像都是很快就给出了反应,但到头来总是差那么一口气。
给我的感觉就像是,若山他似乎能够感受到,可是他又偏偏觉得没有他把握着的信息来得重要,这么一比之后,就我输入的信息丢开了。那你说我该怎么办呢?”写完问题,尼傲有些神经质地搓着手,眼睛盯住屏幕,等着乔臻倩的回话。
“要想有效地把堵塞了信息通道给打开,最好的办法当然是找到与被凌若山牢牢抓着的、不肯放手的信息相关的资料。可是我们都知道凌若山是突然陷入昏迷的,在这之前到底出了什么样的变故,到底是怎样重要的信息让他这么多年来,仍然那么执着地守护着不肯放手,我们一无所知,凭空里也无从猜测。
既然你都说了,你用了常规的,直接的联系方式,都不能突破这个被阻挡住的瓶颈效应,那么在我看来唯一值得一试的就是随机取样了。”
“随机取样?”尼傲喃喃地重复了一句。乔臻倩的建议中规中举,并没有让尼傲感觉到任何惊艳的地方。
从统计学样本分布的角度来说,尼傲也知道随机取样通常都能够比较客观而准确地反映一个群体的真实状况,可是要把这个技术用到凌若山这么个特殊的个体身上,他真的觉得心里没底,甚至可以说是很怀疑其效果。
要知道患有阿斯伯格综合症的人的思维方式,可真不是能够用一个普通正常人群的平均水平来加以衡量的。如果拿一条曲线来做比较,正常的人偏好可能是一个正态分布的贝尔曲线(中间脯两边低,像一口时钟一样),而凌若山这一类人的表现则多半是反其道而行之,所思所想,那一定都是属于极少数,绝不是一般的常人所能想象和代表的。
就像是小时候,一般小孩喜欢小动物,也就局限于养只小猫小狗什么的,带着出去遛遛、回家逗着玩玩。可凌若山着迷的是这世界上的猫狗有多少种分类,进化的起源、都分别怎么分布,骨骼形态,生存周期这些只有动物学家才感兴趣的内容。
更何况尼傲记得康远途说过,用随机筛选的方法,见成效的时间会相对比较长,这个很容易理解,也完全可以想见。在尼傲看来,从某个程度上来说,这就和买彩票一样,想要只买上一次两次,就能撞上大运中上大奖,那完全得靠人品。
这样的话,就算自己是若山的死党,在一点提示都没有的情况下,也还是很难猜到当年若山看到了些什么。这随机取样得随到什么时候才能取到那小概率的样啊?
对于尼傲这种喜欢“没考虑胜利,先琢磨失败”的人来说,喜欢在走下一步之前,就预先计算好个十七八步,最习惯就是把一切都牢牢地安置于自己的掌控之下,而最讨厌的就是听天由命,依靠那虚无缥缈的运气来成事。
“就不能够有别的办法了吗?这和买一注就想中彩头奖的概率差不多大啊。这真的就是我们现在唯一的选择吗?”
不知道是什么原因,尼傲觉得自己有种抑制不住的急迫感。冥冥中他总有一种感觉,似乎有什么重要的事情即将要发生,而且对凌若山来说,很可能是一个向着好的方面发展的重大转机。他直觉到那是万万不能错过的。
乔臻倩却是笑着摇了,都说胖的人是慢性子,看来尼傲还真不能算胖。
“你可别小看了这随机取样的方法,这是有讲究的。那可和在大街上随便抽个签碰碰运气大不一样,这里头的学问可多了去了。
随机的方式可以有很多种,比如均一型的,也就是在一定的取样区段内,所有点的出现频率是相同的;但也可以是跳跃型的,比如用多元方程的曲线为基础,出来的取样结果就会大大的不同。针对不同的对象,应用不同的取样方式,就能大大地加快筛选的进程。”
乔臻倩的话令尼傲恍然大悟,一说到和数学相关的东西,他理解起来总是非常迅速。
“那么若山的这个状况,应该用什么样的取样模式才最为合适呢?”
这个问题乔臻倩事先也有考慢,还为此特意查了相关的资料:“资料都给你准备好了。
现在对于阿斯伯格的患者的了解比以前多得多了,很多国内国外的科研工作者对于他们的思考和行为模式,都进行了数学模型的构建和演绎。从现有的数据来看,阿斯伯格患者的定位区段,基本可以推导为幂函数的尾端靠近99。95%的位置,也就是说从一个一万个人的群体来说,只有五个正常人的想法有可能会和一个阿斯伯格患者的想法相类似。
所以做抽样的时候,如果重点考虑这个区段的样本,或者提高该区段以及其周围区段的数据的优先级别,就能够在很大的程度上提高筛选的效率。具体怎么用程序来抽,那可就是你的专长了。”
乔臻倩的解释顿时令得尼傲茅塞顿开,数据筛选可以分做两个大的类别。一个是没有任何背景知识,完完全全从数据本身当中去寻找规律。而另外一种就是对数据地点有一定的知识,对于数据所可能产生的模板规律有一定的引导,而乔臻倩说的正是后面的这一种情况。
说穿了,和游戏的掉宝率也有那么点共通之处。当游戏运营商做活动推广的时候,两倍、三倍的掉宝率其实也就是把那个触发宝物掉落的随机数字给处理一下而已。
可是道理明白了,真要做起来却还是不容易。在尼傲看来,要想用这种有监控型的随机方式来自动产生能够和游戏互联的接引程序,有几个方面的工作要做。
首先要随机产生话题,然后产生的话题要经过过滤。绝大多数的热点话题,在这个步骤中都会被清除掉,只留下那些被界定在最后五个万分点里的冷门中的冷门。
再接下来,就要把这些冷门话题再尽量转化成为,能够均衡地影响到各个信息通道的全方位接引程序,随后再自动地接入到凌若山所戴的头盔里,这一切可一点都不简单。
虽然尼傲是个编程序方面奠才,可是再天才的牛人,程序也得要一行一行的才能够写出来。而且那些最终幸存下来的冷门话题,他可吃不准有几个是他知道的,估计多数都会是他闻所未闻的内容,那就还必须去做相应的背景了解,只有在做了足够的预备测试之后,这才能最后用到实际的试验里。
尼傲粗粗地估计了一下,这不吃不喝不睡觉,怕是,没有个三五天时间都下不来,而且这还没算上那不能预见到的实际筛选可能会花的时间。想到这里,本来满腔热忱的心,好像被那突如其来的暴风雨给浇了个通透,瞬时间就降到了冰点,以至于尼傲一时间给愣住了,似乎眼前这千头万绪的,一下子不知道应该从哪里着手才好。 作者 葡萄籽