一组研究人员开发了一种机器学习模型,该模型可以从新闻文章的内容中提取信息,有效预测面临粮食不安全风险的地区。该模型可用于帮助在脆弱地区优先分配紧急粮食援助,标志着对现有测量方法的改进。
纽约大学科朗数学科学研究所访问研究员、世界银行数据科学家Samuel Fraiberger说:“我们的方法可以通过实时信息流和易于解释的预测模型,大大提高提前12个月预测粮食危机爆发的能力。”该研究报告发表在该期刊上科学的进步。
“对粮食不安全风险因素的传统测量,如冲突严重程度指数或粮食价格变化,往往是不完整、滞后或过时的,”Courant研究所教授、该论文的作者之一Lakshminarayanan Subramanian补充说。“我们的方法利用了新闻中提到的引发粮食危机的风险因素这一事实之前用传统的测量方法来观察。”
粮食不安全威胁着全世界数亿人的生命。根据联合国粮食及农业组织的数据,营养不良人数从2014年的6.24亿人增加到2019年的6.88亿人。该论文的作者指出,自那时以来,由于Covid-19大流行、气候变化和武装冲突,情况已经恶化——2021年,全球有7.02亿至8.28亿人面临饥饿。此外,2021年全球和各区域的严重粮食不安全状况都有所加剧。
尽管这一苦难具有严重和广泛的性质,但目前发现未来粮食危机的方法依赖于风险措施,这些措施不足,阻碍了解决这些危机的努力。
在开发一个更好的模型的过程中,这篇论文的作者(包括Courant的博士研究生Ananth Balashankar)考虑了一种可能性,即新闻报道提供了对当地发展的实时、实地报道,可以作为即将到来的粮食危机的早期预警系统。
研究人员从1980年至2020年间发表的近40个粮食不安全国家的1100多万篇新闻文章中收集了文本。然后,他们开发了一种方法,从这些文章中提取与粮食不安全有关的特定短语,并以引人注目的细节捕捉新闻评估的方式。具体来说,该工具计算了近170个文本特征,以便正确判断与粮食不安全有关的短语的语义,并标记文章出现的时间。以下是南苏丹的一个例子,其中概述了地点和风险因素:该国部分地区可能再次出现饥荒,尤其是洪水和虫害肆虐的东部皮博尔县,那里的风险尤其大。"
然后,他们考虑了一系列粮食不安全风险因素的数据,如冲突死亡人数、降雨量、植被和粮食价格变化,以确定这些因素的新闻提及与它们在研究国家和地区的发生之间是否存在相关性。在这里,他们发现报道的性质与这些因素的实地发生之间存在高度相关性,这表明新闻故事是所研究条件的准确指标。
但要确定新闻文章是否真的是好的预测对于随后的粮食危机,该小组需要知道报道的性质是否可以作为一个可行的指标未来危机,以及这些故事是否比传统的衡量方法更准确。研究人员使用一组较小的新闻报道发现,从2009年到2020年,在21个粮食不安全的国家,新闻报道对当地粮食不安全状况的预测更为准确,而且比不包括新闻报道文本的传统测量方法提前了12个月。值得注意的是,他们还发现补充结合新闻报道的传统预测方法进一步提高了粮食危机预测的准确性,表明了“混合”模型的价值。
研究人员还看到了他们的工作的潜在更大用途。
Balashankar说:“新闻指标可以扩展到预测疾病暴发和气候变化的未来影响。”
期刊引用:
引用此页: