作者:埃里克·华莱士

雌性绿头鸭及其雏鸭(CO Rob Bielawski)
一支专门的 eBird 审查员团队正在幕后工作,以确保弗吉尼亚州 eBird 数据库的准确性。电子表格奇才 Rob Bielawski 正在帮助彻底改变数据过滤过程。
除了三名全州审查员之外,还有七名地区专家组成了审查小组。这些志愿者共同担任该地图集的第一线质量控制人员。
“为了维护数据库的完整性,并使其能够被科学和保护界所使用,我们的数据质量必须很高,”VABBA 2主任 Ashley Peele 博士说道。“如果没有这些忠诚的男士和女士的帮助,那将是不可能的。”
如今,这一流程与30年前相比已大不相同。“那时候,一切都是手工完成的,”地区 eBird 审阅员 Mike Stinson 说。斯廷森 (Stinson) 是早期繁殖鸟类图谱方面的资深专家,他于1985自愿参加第一届 VABBA。筛选手写记录以查找异常情况既危险又耗时;整合 eBird 的在线数据库和数字过滤技术可显著提高效率。
然而,参赛作品数量也同时增加。与 VABBA 的约400观鸟者相比,已有超过950观鸟者为 VABBA 做出了贡献2 。截至2017年该图集第二季结束时,此次提升已产生了超过500 、 000记录。
“数据量非常庞大,而且每天都在增长,”皮尔说道。“如果我们仍然手动审核每条记录,我们需要的人力远不止十一个人。”
这就是 eBird 数据过滤器发挥作用的地方。就像一组自动事实核查员一样,他们帮助国家审查人员找到可能存在问题的条目。

巢中的蓝灰色捕蝇器 (CO Rob Bielawski)
“当你向 eBird 提交一份清单时,每条记录(即物种条目)都会与数据过滤器进行比较,以查看其是否符合某些预期标准,”Rob Bielawski 说。作为一名全州审查员,Bielawski 自2015以来一直致力于维护和改进联邦的 eBird 数据过滤器。“如果条目不符合这些标准,就会被标记为需要审核,并被发送到审核队列,以供本地审核员进一步审核。”
典型的标志包括在鸟类不太可能出现的地方、浓度过高的地方或在它们不应该出现的时间发现鸟类。
例如,“如果 12 月份在布莱克斯堡附近看到一只黑喉蓝莺,那一定非常了不起(尽管那件事发生在2017 !),但如果 5 月初到 5 月中旬出现几只黑喉蓝莺,人们就不会感到惊讶了,”Bielawski 解释道。同样,“在三月份观察到一群1 、 000雪雁并不会令任何沿海观鸟者感到不寻常,但在八月份看到一只雪雁也绝对是值得注意的。”
由于 eBird 向所有级别的观鸟者开放,因此对相似物种的错误识别是另一个常见的问题。颜色和身体特征上的细微差别常常会导致好心的新手观鸟者将一个物种误认为另一个物种。
尽管 Bielawski 很快表示“观鸟界总是会发生奇怪的事情,这也是乐趣所在”,但他强调 eBird 过滤器的目的在于“捕捉异常报告,以便当地专家进行调查”。后续的审查过程维护了 eBird 数据库的完整性。
当条目被标记时会发生什么?
“我们总是希望对方有一张照片,可以明确地回答‘是’或‘否’,”Bielawski 说。如果没有,他会仔细检查观鸟者的笔记,寻找异常情况和线索,以帮助他了解观鸟者所看到的情况。有时,错误就像打字错误一样简单。“现在,如果我正在审查一条被标记的条目,其中有人说他们在弗吉尼亚海滩看到了十只翠鸟,我会怀疑这可能是一个意外的错误输入 - 也许是本来应该输入的‘ 1 ’却被输入成了‘ 10 ’。”
在无法直接做出决定的情况下,Bielawski 会发送一封电子邮件询问有关目击事件的问题。他说,大多数观鸟者都明白评论的重要性,并且乐意提供帮助。

Rob Bielawski,弗吉尼亚州 eBird 过滤器专家
“我们的目标是共同努力,描绘出更真实的景象,让人们了解那里的实际情况。”Bielawski说道。他致力于他所说的“崇高事业”,除了全职从事工程师工作外,他还每周花费超过20小时志愿服务于 eBird 和 VABBA 2相关任务,包括数据过滤器维护、审查 eBird 记录、管理 Atlas 社交媒体渠道以及维护弗吉尼亚鸟类学会网站(该项目的主要赞助商之一)。除此之外,他仍然会抽出时间到野外进行勘察。“我这样做的一个最大原因是,除非你了解整个故事,否则你就无法帮助一个物种。”为了帮助数量不断减少的鸟类,自然保护主义者需要“知道它们在哪里,不在哪里”。
最重要的是,要准确了解鸟类状况,就必须有准确的记录。
Bielawski 对 eBird 数据过滤器的工作不仅仅是简单的维护——作为一名具有数学头脑和操作电子表格天赋的土木工程师,他有着雄心勃勃的改进目标。
“当我加入2015公司时,我们大约有20区域数据过滤器,”他说。这位34岁的年轻人希望“扩展该系统,以包括针对较小区域以及必要时的独立城市和县的自定义过滤器。”这样做将导致记录“更准确地标记为需要审查”,并最大限度地减少 eBird 用户和审查员的低效率。
未来可能的增强功能可能包括按海拔过滤的能力。这将大大减少蓝岭山脉等地区的假旗事件,因为那里许多鸟类在高海拔地区繁殖,但不在附近的山谷繁殖。例如,“虽然暗眼灯草鹀会在 Skyline Drive 沿线繁殖,但它们在夏季在过滤区域约99 % 的区域内并不多见,”Bielawski 说道。因此,当观鸟者提供准确的目击信息时,他们的观察结果就会被 eBird 标记。“像这样的高度问题会给观察员和审查员带来不必要的努力,所以我们的目标是尽可能地减少这些问题。”
“我的目标是不断改进,”Bielawski 说道。尽管他不情愿地承认过滤器“可能永远不会完美”,但县和市一级的定制无异于革命性的。然而,他说,对于鸟类来说,人为的界限在很大程度上仍将是任意的。“根据特定的栖息地创建过滤器会很棒。”尽管他对此类项目的可行性表示怀疑——栖息地过于分散,以至于在这种规模上进行微观改进可能是不可能的——但 Bielawski 仍然坚称,他计划“尽可能接近”这一目标。
Peele 博士还希望有一天能将繁殖代码过滤器纳入标准 eBird 审查系统。目前,每年冬天都会在 eBird 系统之外进行一层密集的 Atlas 数据审查。“在 Atlas 区域协调员兼里士满大学教授 Lewis Barnett 博士的帮助下,我们开发了专门用于审查育种数据的代码。”该代码标记 eBird 记录中潜在的繁殖代码错误,然后在淡季进行手动审查。这一年度流程涉及数以万计的记录,是地图集数据质量控制的第二道防线。
~ Eric Wallace,VABBA 2通讯公司
