隐忧已经慢慢浮现,马竞虽然郁闷发愁,却也只能慢慢解决。
马竞作为个人开发者,对于蜜蜂输入法的技术支持和客户服务做的很差。
虽然e7u提供技术支持的蜜蜂输入法程序端非常强壮,很少出现严重bug漏洞,但是架不住国内用户软硬件配置的奇葩。在一些落后或者小众的硬件上,就很容易出现各种莫名其妙完全无法预料的毛病,而因为马竞与外界的联系只有他电脑上的gprs小水管,所以很多反馈并不能得到及时处理,因此丢失了不少新用户。
同时曾经帮助蜜蜂输入法获取初期用户的一个利器——词语关系数据库功能,也被怀疑存在窃取用户信息的恶行,一些公司已经开始禁止使用蜜蜂输入法了。
在发现这一情况后,在1。1版本里面马竞把词语关系数据库功能暂时禁用了。
这个功能允许用户在输入一些词语时,输入法对候选词当中的一些词语进行特殊标记和调序。
比如用户输入“食蚁兽以白蚁为食”时,当他选词选中“食蚁兽”时,后面的“baiyi”拼音对应的候选词第一位就会是背景高亮显示的“白蚁”,而不会是“白衣”或者“百亿”。
这是因为“食蚁兽”和“白蚁”有“关系”,不管是食物链关系还是别的什么关系,有关系优先显示就对了。
有比如用户输入全班同学名录时,输入同学甲的名字之后,再打人名时其他同学的名字会被高亮优先显示。
这是蜜蜂输入法通过某些途径把这些名字关联到了一起。
而这些途径很可能是非法的。
所以马竞暂时关闭了关系词库功能,从头整理蜜蜂的所有词库,重建关系词库,确保蜜蜂官方提供的词库里面的词组、以及词组间的关系数据都是类似“食蚁兽和白蚁一样的公开关系”,而非“私人秘密关系”。
因为当时在学校上网不方便,他只好暂时禁用了关系数据库功能。
今天马竞发布了1。11升级补丁,把词语关系数据库这个很有潜力的功能重新开放,还把关系词库的导入功能开放给用户。
同时把他前几天整理的几个新版词库上传到了服务器上面。新版蜜蜂输入法只支持新版整合词库里面的关系词库功能。旧版输入法可以正常使用旧版词库,但是关系词库功能禁用。
好在关系词库都是在线词库,因此禁用关系词库非常简单,马竞所谓在服务端设置一下就完成了。
马竞注意到这个情况还是因为有一位热心用户,前段时间给他发了好几封邮件给他提的醒。
那位热心用户在打印公司客户名单时发现,合作过的客户公司名、客户名字会被特殊标记,而他在以前没有输入过这些词。结果询问发现是另外一名同事同时输入过这些词,而蜜蜂输入法似乎记录了这两个词,并且把它们联系到了一起。
因此那位热心用户就给mj发电子邮件,强烈建议蜜蜂输入法关闭或者调整这个功能。因为不告而取是为贼,蜜蜂现在的做法往小了说是侵犯用户隐私,往大了说就是窃取商业机密了。
实际上蜜蜂输入法给热心用户的合作客户和客户公司名字建立联系不是靠的键盘记录,而是“词库生成器”(从以前的蜜蜂发布器升级而来,自动搜集文本文件建立新词库)通过分析该公司网站上面的公开数据得来的。马竞也是这么回复他的,同时表示为了避嫌还是会整改相关功能。
“窃取商业机密”这个说法把高中生马竞吓了一跳,上网一搜发现他自己的行为的确能算上窃密了。
马竞认真考虑之后,很快就做出选择选择整改关系数据库。
以前他设计蜜蜂输入法就是为了能够找到自己的仇家,对于软件本身的形象和发展关注的不够,有些急功近利。
以往关系数据库都来自蜜蜂发布器基于整站下载然后文本分析得来的结果,其中有不少内容都有侵犯隐私的嫌疑。这些有瑕疵的内容现在正在被马竞逐步清理。
新版词库里面全部都是基于词语间各种公开关系而生成的关系词库,但是用户可以把一些私人关系数据导入到关系数据库里面,并且设定一系列关系提示方式。
同时马竞以蜜蜂工作室mj的名义承诺用户私人创建的关系数据将只有其本人帐号可以使用,并在服务端被强力加密。蜜蜂工作室将不会利用用户的输入数据创建关系数据库,蜜蜂提供的关系数据库将只包含各种公开传播的关系数据。
固然这样做会大大降低蜜蜂输入法的输入准确性,但却是软件走向正规化必须走的一步路。
把一些还没有整改的词库下载到脑盘,马竞把注意力转向蜜蜂安全。
这款四不象防毒软件在过去一段时间借助蜜蜂输入法低强度定向推广(检测到用户电脑未安装杀毒软件时会进行提示),装机量勉强突破了十万。
马竞连接到蜜蜂安全的p2p网络以后,仿佛真的进了一个蜂窝一样,嗡嗡嗡嗡嗡地吵个不停。
当然这是形象的比喻,其实蜜蜂安全的p2p网络里面都是文本信息来着,只有刷屏的数据流没有噪音的。
看到它们,马竞却是满脸笑意,这些不断刷屏的数据其实是蜜蜂安全的核心技术与核心竞争力。
蜜蜂安全本质上是一款防毒软件而不是杀毒软件,以前还叫蜜蜂杀毒时候的病毒特征库都是借用其他收费杀毒软件的,等升级成蜜蜂安全之后就把涉嫌盗版的病毒特征库拿掉了。
没有病毒库还怎么杀毒?
蜜蜂安全使用了防贼神器“居委会大妈”,呃不,是类似“治安联防体系”的“风险通报防毒体系”,也就是这些刷屏的广播消息。
每一个在线的蜜蜂安全客户端都会把它们的查毒记录通报给p2p网络,并在一定ip范围内被转发扩散。
在这个体系下,每一个蜜蜂安全客户端都是辑毒犬,每一个蜜蜂安全客户端都是预警器。
蜜蜂杀毒有一个很强劲的虚拟机,可以高效模拟用户电脑,新的可执行程序第一次运行都是在虚拟机模式下运行的,根据其行为:打开关闭什么文件,访问什么网址,运行关闭什么程序,修改什么系统设置等等,蜜蜂安全会为其记录一个“应用程序履历表”,并且和它的邻居(局域网以及附近ip接近的其他蜜蜂安全客户端)进行通报。
只有来源清白,行为长期清白的应用程序才会进入白名单,降低关注强度。说起来这个理念和那个被“杀毒软件公司传播病毒”“丑闻”害的不能上市的微点防毒产品的理念有些相似,都是基于行为判断。