当前位置:首页 > 公众号精选 > C语言编程
[导读]丰色发自凹非寺来源:量子位(QbitAI)“代码拖更”的经历,不知你遇到过没?就是你看上了一篇论文或者项目,作者声称代码会开源或者已开源,但你左等右等,每天查查GitHub,代码就是一直没发布……reddit上一位网友就遭遇了这种经历,还是在他三番五次联系原作者的情况下。无奈/一...

丰色 发自 凹非寺
来源:量子位(QbitAI)
代码拖更”的经历,不知你遇到过没?


就是你看上了一篇论文或者项目,作者声称代码会开源或者已开源,但你左等右等,每天查查GitHub,代码就是一直没发布……



reddit上一位网友就遭遇了这种经历,还是在他三番五次联系原作者的情况下。


无奈/一怒之下,他就把作者和论文挂网上了。



结果这一现象引起了网友们热烈的讨论,还把“涉事”作者给“炸”出来了!


声称代码开源却迟迟不更新

据发帖网友陈述,“涉事”论文是NeurIPS 2020的一篇有关自动驾驶的论文。


当时他觉得很有意思,顺着文中给出的代码地址点进去,发现仓库居然是个“空壳子”。


“好吧,应该是还没来得及更新”,他心想:那就fork一下,过几天再来看。


然而他等啊等啊,代码一直都没有发布。


他看到有其他人也在评论区“催更”,他自己也尝试电邮联系作者们(包括学生和PI),但都没收到回复。


终于,去年11月份就提交到arXiv的论文,在今年4月更新代码仓库了!


——但,更新的只是自述文件,只说代码即将发布。


然后几个月过去了,那已成了该仓库最后一次更新。



而这位网友也终于联系上了作者,却得到了这样的回应:


论文实际上是基于经验的改进,没有有效代码来复现结果。


这下这位网友可是真的炸了:“我等了你们这么久,付出了巨大的努力联系你们。不发布就不发布,一开始就别承诺啊,也更不该‘玩失踪’啊。”


他表示,他知道这种“声称开源却实际并未发布代码”的事情在机器学习论文中越来越多


当他实验室的本科生问他“为什么我应该如此费力地整理代码并发布,而别的人早已开展下一个有趣的项目去了”时,他也没法儿解释。


事情不应该是这样


我强烈地认为这种事情必须被改变,而且只有我们说出来,这种现象才能被改变。


于是,也就有了前文我们看到的这篇论文被挂在网上“社死”的事情。


谁之过?应该怎么办?

看到这个帖子,许多网友的第一反应确实是:这不新鲜啊。


“CVPR 2019都还有篇论文的代码现在还没发布。原作者还亲口告诉我有代码且已上线呢……”



不过,这不排除有人是在论文被接收后又偷偷删除链接的……



毕竟,有网友指出,有人不发就是因为担心自己“透露”的太多,被别人反超成果……



emmmm……


当然,更普遍的也可能是自己的代码遇到问题了,不过:


“Paper Bad Code >>>> Paper No Code。”


许多人表示,论文能公开代码还是要公开,即使有错误、别人跑不起来,但也尽量发出来,大家还可以做逆向工程——毕竟总比啥都没有强。


而关于不发布代码的原因,这里面还出现了“对于你来说开源代码可能就是30分钟的事儿,但有人真的很忙需要耗费数周才能完成,所以你不该责怪他们”的论调,但显然他没有抓住本次事件真正的问题所在:


不能开源代码的情况会有,可以原谅,但你不应该把“代码已在X发布”写在论文中。不诚实才是最大的问题。



而另一边,网友也把矛头指向了评审


“我已经说过很多次了,会议/期刊/审稿人应该确保论文中提到的代码是真正发布了的。”


许多人一致认为先不提有没有验证代码是否能复现,没有复现代码能过审就让人费解,所以给复现代码挂了个空仓库的论文一开始就应该被拒稿,审稿人应该好好把关。



不过说是这么说,有人算了算:


ICLR今年收到了大约3400篇提交,每篇论文应该有4条评论,所以总共需要13000 条评论。而一个好的评审总共需要4-5个小时在一篇论文上


这需要耗费的时间不敢想象,但审稿又是“义务劳动”,你“审的好”不会给你带来什么附加收益,对你找工作、升职加薪什么的也不会有帮助,所以……


那你可能会说,付费评审吧。


但这不且提每小时约100美元的市场价格带来高得离谱的成本,有的人给钱他都不一定有那么多时间呢。



再扯远点,最不缺的是审稿人,而是真正有水平的审稿人。



所以也就发生了太多空代码论文“钻空子”的情况。


不过,也不是完全没有办法。


有网友支招,面对那种承诺已有代码实际就是没有的,可以把它提交到下面这个网站



会有人专门帮你联系作者,其审核严格,也会显示每篇论文的处理进度。



从申请理由中,我们也可以看到,代码有问题的论文也可以提交的。


良心网站。


“涉事”论文作者被“炸”出来了

令人没想到的是,原帖网友私下三番五次联系不上“涉事”论文作者,发了这个帖子后,倒是一下子把他“炸”出来了。



他首先道歉,表示自己刚刚进入一家公司工作很忙,没有及时跟踪到这篇论文的邮件。


承诺在最近的NeurIPS之前会发布代码,到时大家有啥问题就可以问他了。


还给出了代码用到的数据集来自哪篇论文以及根代码库的链接。


以上,你怎么看?


参考链接:
https://www.reddit.com/r/MachineLearning/comments/qrbkc7/d_calling_out_the_authors_of_trajformer_paper_for/


版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!




本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京2022年10月19日 /美通社/ -- 10月18日,北京市经济和信息化局发布2022年度第一批北京市市级企业技术中心创建名单的通知,诺诚健华正式获得"北京市企业技术中心"认定。 北京市企业技...

关键字: BSP ARMA COM 代码

实际上函数指针本质也是一个指针,只不过这个指针指向的不是内存中的一段数据而是内存中的一段代码

关键字: 指针 数据 代码

(全球TMT2022年10月17日讯)上海安势信息技术有限公司的清源SCA工具在腾讯成功部署。清源 SCA可进行代码片段识别、文件识别、组件识别、依赖识别和容器镜像扫描。清源SCA拥有海量数据储备,其中包含24万漏洞数...

关键字: 腾讯 组件 开源 互联网

苏州2022年10月17日 /美通社/ -- 开拓药业(股票代码:9939.HK),一家专注于潜在同类首创和同类最佳创新药物研发及产业化的生物制药公司,宣布其自主研发、潜在同类首创的福瑞他恩(KX-826)治疗痤疮的中国...

关键字: ST FDA 代码 ADI

上海2022年10月14日 /美通社/ -- 近日,上海安势信息技术有限公司的清源SCA工具在腾讯成功部署。 开源软件在促进全球的技术创新方面发挥着越来越重要的作用,企业越来越依赖开源软件来加速开发与创新,根据 Gar...

关键字: 开源 开源软件 组件 数据库

10月12日消息,据开放原子开源基金会,日前,北京万里红科技有限公司(简称“万里红”)发布了针对行业定制、搭载T618芯片和OpenAtom OpenHarmony(以下简称“Open...

关键字: 平板 开源 芯片 鸿蒙

在智能汽车时代,保障智能汽车数据安全已成为一项新的重要课题。

关键字: 丰田 代码 信息安全

北京2022年10月8日 /美通社/ -- 日前,全球领先的IT基础设施提供商浪潮信息加入龙蜥社区并成为理事单位,致力于携手社区生态伙伴,共同推动开源操作系统的全产业链协同创新和产业化应用。 龙蜥社区成立于2020...

关键字: 开源 操作系统 通信 大数据

(全球TMT2022年10月8日讯)IT基础设施提供商浪潮信息加入龙蜥社区并成为理事单位,致力于携手社区生态伙伴,共同推动开源操作系统的全产业链协同创新和产业化应用。 龙蜥社区成立于2020年9月,是国内...

关键字: 操作系统 开源 通信 装机量

南京2022年9月16日 /美通社/ -- 说到"世界清洁地球日",恐怕很多人都一头雾水。作为全球最重要的环境保护活动之一,该节日"致力于通过影响人类行为模式的改变以应对世界上的垃圾问题&q...

关键字: 电热水器 BSP 温度 代码

C语言编程

178 篇文章

关注

发布文章

编辑精选

技术子站

关闭