第473章 跑步进场
“汇聚全世界的资源,分享你我他的快乐……”
听着郑秋缓缓读出这条产品介绍,俞华忍不住砸吧砸吧嘴。
“嗯!听着的确像是某种资源分享平台?”
郑秋登时无语,翻着白眼指了指下面的一行小字。
“这么牛逼的公司怎么可能这么肤浅!看下面!
精选优质知识资源、促进教育方法改革、提升人才质量、推动智慧分享。
弘扬中华文化,吸收世界文明。
加快脚步迈入知识型社会——广大莘莘学子的福音!
这格局……一听就大的没边了!”
“某个相亲网站还喊口号说自己想促进人类繁衍,延续地球文明呢,大的没边谁不会啊?”
“嗯……相亲网站?”
郑秋狐疑的盯着面前的大龄光棍。
“咳!这都是小细节,那什么,我们快点进去看看有没有什么惊喜吧,这可是白夜纪出品!
唔……上面写着可以用天枢erp或者八戒的账号进行同步完成注册,咱们都没有。
如果是新用户,那么个人账号注册则需要实名认证,等会儿……”
于是,注册……输入身份证号……绑定手机号……
一番操作之后,俞华获得了一个初始账号。
登陆之后,眼前立刻切换到了一个看着十分简洁的新界面。
左边是个信息栏,除了自己的个人姓名和待编辑资料外,还有一个叫做“智慧币”的东西,目前数额为5。
右边则是光秃秃的什么都没有,就一个孤零零的搜索框,背景则是白夜纪的机器人logo。
“这东西怎么用?”
“既然是知识类的分享平台,那应该是类似搜索引擎的东西,先输入一个搜索项目试试看。”
于是俞华随手输入“人工神经网络(ann)随机森林算法相关期刊论文”……
这也正是他目前的研究课题。
“刷!”只见界面一变。
10篇相关论文及其简介就一项项出现在两人面前。
“咦?还不错诶,上面头几篇都是这个领域引用次数较多,权重较高的权威论文……
看!第10篇还是你去年的论文!”俞华惊喜道。
郑秋抢过鼠标,点开自己那篇论文,果然,是自己写的没错,上面清楚的标注了著作人和发表时间。
看着自己的作品,郑秋有些臭屁的点点头。
“嗯!看来这个检索还是有些眼光的嘛!”
俞华懒得搭理这个自恋狂,又点击下一页,继续查看检索顺序10~20的其他论文,果然又发现了好几篇熟悉的业内权威。
一直到第100篇,几乎没有一篇是无效的“水文”。
就这检索效率和效果,就绝不比蜘网来的差了。
而且令人惊讶的是,别的网站通过期刊论文检索出来的,只要年份稍微久远点,一般都是图文版,也就是用相机扫描下来的。
因为以前电脑普及度不高,论文大多还只是进行纸质存档的。
就算后来电脑普及了,一篇篇重新机打出来也是一项异常庞大浩瀚的工程,所以只能扫描电子化进行存档。
只不过,那清晰度就像是在对着电脑看旧报纸,很影响阅读体验。
比如有一篇《随机向量学习模型》,他明明记得,在蜘网的检索数据库中它还是一篇扫描文档。
然而这里显示出来的,却是清晰完整的电子档。
就连文章中的表格和图文,也进行了高度还原原著的电子化重制,让人一目了然。
就算是原作者看了,怕是也只能说一句“无懈可击”……
“这帮家伙,该不是把旧的数据库文献全都给优化了一遍吧……”
郑秋脑子里突然蹦出一个极为不可思议的想法。
这种工程量,绝非少量人力可以完成,唯一的可能就是依靠自动化程序进行批量图文转换识别……
如果真是如此,那这图文转换效果简直炸裂啊!
“这东西说是还能查重来着,不知道效果怎么样……我试试看。”
俞华没忘记自己原本的目的,当即从电脑里找出一篇已经审核过的硕士生论文,按照提示直接拖入对话框……
【请问是否花费1智慧币进行查重服务?是/否】
“原来要花站内币啊……1币一次,这样看来每个新用户都有5次免费查重机会?还不错。”
俞华心里还是有些满意的。
虽说不是完全免费,总比那些个上来就直接弹付款码的要好些。
选择“是”,下一刻,画面上蹦出一个进度条。
大概3分钟的功夫,进度条就缓缓拉到底,最终跳出来一个大号数字——重复率69.3%!
“啥?69.3%?”俞华脸上有些错愕。
“怎么啦?”
“这篇论文我用蜘网查重过,最后结果是36.2%来着……喏,这是蜘网的查重报告单。”
俞华从旁边的书桌上找了找,递过去一张打印a4纸。
当蜘网查重系统在检测论文内容时,会将论文与自己的系统库进行比对。
如果发现连续出现13个字符,也就是七八个汉字类似,就会判为重复,计算这部分重复率,最后将查重后的数据显示在最后的报告单中。
同时还会在文本中以红色字体显示重复内容,并在重复区域旁标注出该段引用的相关文献。
总的来说,蜘网虽然收费贵,但是就检索结果来说,服务还是比较到位的。
郑秋看着手中的查重报告单,又看了看电脑上给出的69.3%的高重复率,皱了皱眉。
“别的不说,就这查重速度,就快的有些匪夷所思了,该不是互联网算命……玩随机那一套乱给的吧?”
刚刚那进度条,满打满算也不超过3分钟。
3分钟,看似有些漫长,但相对规模庞大的文献数据库检索量来说,简直快到不可思议!
要知道,蜘网的单次查重耗时一般为30~60分钟,在毕业高峰期间甚至会超过2个小时。
相比之下,这样的“查重”耗时,多少显得有些儿戏了。
什么样的运算速度和检索算法,能在这么短的时间内检索完那么庞大的文献库?
“不可能吧……这么优秀的公司,而且人家也给了查重结果的。”
俞华说着点开下方的“查重报告”按钮。
下一刻,电脑前的两人都愣住了。
画面上,这篇论文超过一半的地方都被红色标注了出来,旁边挂了引用文献和对应跳转链接。
密密麻麻的根本不像是胡编乱造……
“真的假的啊?”郑秋有些傻眼。
他一把拿起那份蜘网的查重报告,开始逐行比对。
“这个有,这个也有……嘶~全中!”
蜘网检索出来的重复段落标注和引用文献,这里全都有,而且还贴心的给了文献链接,真假一目了然。
那么多出来的这些……
通过两人比对,得出了一个令人震惊的结论。
那就是这个智慧树所检索的数据库……居然比蜘网来的还要全面!
通常来说,论文查重系统的数据库,主要包括“学术期刊数据库”、“学位论文数据库”以及“互联网数据库”。
这其中“互联网数据库”最为复杂,指的是大量的网页、博客、论坛等互联网信息资源。
论文查重系统会将互联网数据库作为重要的对照,检测论文中是否存在互联网上已被公开发布的相似内容。
“卧槽!对方哪儿来的这么庞大的数据库资源?”俞华不解道。
下一刻他似乎是反应过来……
“该不会,是爬虫程序吧?”
国外有个牛逼的程序猿,靠着编写的强大爬虫程序,抓取了世界上超过6亿个网站的网络公共资源!
最后就连骨歌、亚马孙、adobe、ebay等互联网大厂,都前来寻求数据支持。
一桌一椅一电脑。
单枪匹马搞出了年营收1400万美元的夸张战绩!
而整个公司仅有一个员工,堪称有史以来商业效率最高的企业!
所以……会爬数据,也是绝对的高科技!
“不止!你看,就连图表或者公式的抄袭……对方也能检测出来!”
郑秋指着一串字符旁的标注震惊道。
蜘网的检测技术是有缺陷的,部分“图表”,“mathtype编辑公式”,“word代码”都不能识别,这就留下了一些漏洞。