吕小康 (南开大学社会心理学系; 南开大学计算社会科学实验室)
摘 要:采用 R 语言的 rvest、tidyverse 及 ggplot2 系列包,利用《心理学报》官网爬取并统计2003至2020年间正刊上发表的2281篇实质性论文的信息,基于其收稿日期与出版日期计算所有论文的发表周期(发表日期−收稿日期)并按年度汇总统计。结果显示,此18年间《心理学报》的年均发表周期在290~432天之间,最长的3年分别为2007(432天)、2015(417天)和2014(414天)年,最短的3年分别为2005(336天)、2003(294天)和2004(290天)年,分布较为均匀;单篇文章的发表周期在45~1561天(约4.28年)之间,方差较大;不论短周期还是长周期文章多集中于2014年及之前,2015年及之后的发表周期波动相对较小。这说明最好(坏)的日子可能已经过去,《心理学报》的投审周期已进入常态化运行的稳定阶段。关键词:我本将心;奈何明月
1 引言
有首非著名情歌是这么唱的:
你到底还要让我等多久/你可知我有多难受/我不会随随便便爱了就走/我的爱已覆水难收你到底还要让我等多久/把心掏给你够不够/别再为你的放纵找借口/把话说清楚你再走眼看着爱情流走/谁愿意善罢甘休/是让爱继续还是要分手/已到了决定的时候—— 龙晓飞:《到底让我等多久》
声明一下,这歌不是唱给情人的,是唱给审稿人和编委会的。18年了,号称“中国最具国际影响力学术期刊”的国内心理学刊物——《心理学报》(以下简称《学报)——究竟是如何对待我们投稿人(打工人)的?评价指标当然不一。拒稿率也许是令人伤心的指标,而发表周期(包括投稿检查、外审、修改、接收到出版的全过程)是另一个令人关心的指标。基于数据可获得性的局限与个人精力的有限,这里暂只探讨《学报》的发表周期。其中,发表周期的操作定义为《学报》官方网页给出的收稿日期与出版日期(精确到日),用出版日期减去收稿日期,即得到发表周期的天数(可转为周数、月数或年数,如下图)。
2 方法2.1 对象由于2002年及之前的许多文章并未在网页上直接公布收稿日期,故只选取2003~2020年发表的所有实质性论文,剔除增刊、年度审稿专家名录、会议通讯与纪要、年度总目录(另2018、2019、2020未见总目录)、重要心理学家的悼文与诞辰纪念文、特邀编辑发言或专栏介绍等链接;剔除《中国心理学会相关伦理守则与管理条例》等工作条例链接。对所有论文进行重复性检验,确保唯一性。对部分缺失的收稿信息通过下载原文确定收稿日期并进行人工补充。最终得到2281篇论文的相关信息(见GitHub链接文件:xb_03to20.xlsx, 。
不确定2281篇文章是否完全对应所有实质性论文,但即便有一定误差,应属“爬虫误用”,不影响主要结论。
2.2 工具
采用R 4.1.0及rvest、tidyverse及ggplot2包作为爬虫、清洗、分析和绘图工具。
2.3 代码
为避免恶意爬虫造成《学报》网站服务器的不必要负担,以及由于链接更新或页面布局变化造成的链接失效,仅提供基于整理后清洁数据(xb_03to20.xlsx)的分析及绘图代码。
对爬虫做简要提示如下:
(1)首先提取并拼接所有期的链接,再次提取所有文章的链接,最后人工剔除所有上述“非实质内容”的文章链接再开始解析网页进行爬虫。
(2)2003年第1期至2012年第8期的文章没有doi,而是按卷、期和文章号等呈现链接,同时这些文章在文章页(指这一文章单独的网页链接)还有“审回日期”;而之后的文章根据 doi 呈现链接,且这些文章的文章页没有“审回日期”。为简单起见,可对这两部分进行单独爬虫,最后再行合并。
3 结果
话不多说,直接看表。
表1 《心理学报》年度发表周期(2003~2020)
年份 |
均值(天) |
SD(天) |
N(篇) |
2003 |
294 |
103 |
118 |
2004 |
290 |
137 |
101 |
2005 |
336 |
136 |
112 |
2006 |
397 |
135 |
110 |
2007 |
432 |
185 |
127 |
2008 |
378 |
157 |
138 |
2009 |
364 |
150 |
125 |
2010 |
417 |
165 |
114 |
2011 |
357 |
126 |
136 |
2012 |
367 |
126 |
147 |
2013 |
354 |
140 |
123 |
2014 |
414 |
147 |
159 |
2015 |
376 |
131 |
133 |
2016 |
408 |
114 |
142 |
2017 |
387 |
138 |
139 |
2018 |
397 |
123 |
126 |
2019 |
396 |
119 |
117 |
2020 |
358 |
125 |
114 |
从表1可见,2003~2020的18年间,《心理学报》的年均发表周期在290~432天之间,最长的3年分别为2007(432天)、2015(417天)和2014(414天)年,最短的3年分别为2005(336天)、2003(294天)和2004(290天)年,分布较为均匀。
同时还有一个好消息和坏消息。好消息是,近5年来(2016年以来),年均发表周期总体呈下降趋势;坏消息是,每年发表的文章总数呈肉眼可见的下降趋势。建议编辑部统计一下投稿数量,以计算出投录比。
以下是不怕搞事的两个表。
表2 10篇最短等待期文章
请自行检索文章的全部作者,可以发现一个铁律:大佬真好,大佬成为大佬真早。是的,我大爷永远是我大爷。
表3 10篇最长等待期文章
我只想问列位,摸着自己的良心问问自己,当时有没有对审稿人产生过如下心理活动:
据说,现在不搞点gay里gay气的图,都赶不上时代了。看来我不给你们露一手,大家还真以为我这个R语言教师是吃素的(郑重声明:我在饮食上真的接近吃素,但在学术上完全是杂食动物):
《心理学报》的发表周期(2003~2020年)注:箱线图(boxplot)的箱(box)中的点表示年发表周期均值;红点表示离群值(outliers)。
再据说,得动图者得天下。那就让它动一动:
4 讨论
写论文最怕写讨论,投论文最怕被慢刀子一拖二骂三毙掉。子曾经曰过:稿固有一死,但死要死得痛快,还要死得明白。投稿与审稿皆是一种修行,投稿需耐心,审稿凭良心。然写与发、投与审之间总存在一种近似永恒的短期矛盾,这或可视为一种科研界的特有文化。此之谓“文化”者,超越应然之境而实然之存在也。借用弗洛伊德之语,本我与超我间的矛盾,或只能通过“一仆二主”之自我的勉力协调、做好批评与自我批评,从而假装维持一种充满正能量的学术打工人姿态。
当然,像《学报》(包括《进展》等)公开一些脱敏数据的做法,或有助于投稿者更为客观地认识到投稿周期固有的漫长待审状态,从而培育合理的“投稿后等待”心态。从预期管理入手做好自我心理建设,可能是每一个投稿人可以尝试的自我修养。反过来,对审稿人而言,在力所能及、保证质量的前提下尽早审回稿件,可能属于一种可以追求的学术美德。
此外,鉴于爬虫过程中若干棘手验证问题,建议《学报》(和《进展》)进一步优化网站设计、署名规范等内容。包括:更正存疑链接;修正缺失日期;修正部分标题放在<h3>标签下的<p>段落中造成爬虫无效或者数据结构混乱的情形(见下方示例,爬虫只需要几分钟,确定这些bug用了好几天的带娃的时间);《审稿专家名录》及其他由编辑部统一发表文章的作者署名,可统一为“编辑部”,而不是“bjb”“其他”等混用。相关存疑篇目见GitHub附录文件xb_problematic_links.xlsx,编辑部可对照修正。
示例:
与多数文章页不同的标题放置形式(网页源代码):
多数文章页的标题放置形式:
注意多数文章页的<h3 class = “abs-tit”>后没再下设<p>标签放入标题文字。宜统一修正。
5 结论
问世间愁为何物,试问投稿人:知否知否,应是拒绝接收。
问世间情为何物,转问审稿人:知否知否,应是屡败屡投。
小编有苦:世间安得双全法,不负如来不负卿。
苍生共祝:努力实现投稿自由与发表自由的有机统一。
以上结论,基于臆测;如有雷同,纯属投射。
致谢:感谢南开大学社会心理学系所有选修本人 R 语言课程的历届本硕同学。
参考文献
仅附“‘审稿等待期’情歌”一曲:
余路还要走多久/你攥着我的手/让我感到为难的/是挣扎的自由—— 赵雷:《成都》
后记
刚写完此文,便兴冲冲欲将结果与诸研究生分享,勉励其进行心理建设以树立良好的科研观、论文观、发表观。于是就有了如下对白:
我(兴奋):大家仔细看看我的研究结果,要理解我的良苦用心。投稿后的等待很漫长,被毙掉也很正常,总之要用颗平常心。学生(摆手):“老师duck不必如此苦心,我们的心理健康得很!这种凡尔赛流派的心理咨询,不适合本土国情。”我(惊讶):“敢问有何高招,可破投稿后焦虑与被毙后创伤综合症?”学生(笑靥如花):“你看啊,我们就从没给《学报》投过稿;以前没有,现在和可预见的将来应当都不会有……”
果然,聊到这里,师生间的高傲都已经尽数体现了。
作者简介吕小康,南开大学周恩来政府管理学院社会心理学系教师,南开大学计算社会科学实验室成员,经常自我赞助进行各类无脑研究(请仔细断句,不要与“脑计划”“类脑”等划上等号或不等号)。
小编推荐往期精华文章:
青少年心理咨询:哪些情况下孩子需要心理咨询辅导
心理测试:你们的爱情堡垒牢固吗??
青少年心理咨询篇:为什么初中厌学的孩子那么多
青少年心理压力需要“被看见”“被重视”
青少年心理问题越来越多发,如何及早发现 |
- 还没有人评论,欢迎说说您的想法!