近日,伊利诺伊大学香槟分校数字农业中心( Center for Digital Agriculture,CDA)宣布成立AI AgriBench联盟,旨在评估农业领域AI问答系统的可靠性与准确性。
随着生成式AI技术发展,自动化农业问答服务日益普及。然而,这类系统提供的农作物生产建议若不准确,可能对农场收入、土壤健康和家庭农场可持续经营造成严重影响。
AI AgriBench联盟的核心目标是为农民、政策制定者和公众提供可信的评估机制,确保新一代AI农业工具能够提供准确可靠的技术信息。
正如拜耳作物科学农学数字创新副总裁Tami Craig Schilling所言:"生成式AI在农业领域具有巨大潜力,但其成功取决于我们对准确性和可靠性的共同承诺。通过行业合作建立标准、测试模型并共享基准结果,我们可以建立信任,确保这些工具对农民及其顾问有价值。"
该联盟由CDA内的CropWizard项目牵头组建,创始成员包括:
伊利诺伊大学香槟分校
拜耳作物科学(Bayer Crop Science)
KissanAI
Extension Foundation
联盟向所有有意贡献专业知识支持基准测试工作的组织开放。
伊利诺伊大学香槟分校教授Vikram Adve强调:"评估农业AI问答服务的准确性既重要又具有技术挑战性。这类服务的准确性至关重要,因为不准确或无效的作物管理建议可能会危及农民的生计和农场环境。"Adve教授表示:"我们很高兴能够协调一个公开、开放的联盟,支持可信赖的AI服务,造福农民和更广泛的农业社区。"
未来几个月,联盟将召集成员并在公开网站上维护评估排行榜。任何组织都可以使用该平台评估其模型并公布评分。评估方法、数据集和治理流程的详细说明也将公开,由CDA管理的独立监督委员会负责监督联盟运营。
AI AgriBench整合了学术界和产业界在AI和农学领域的专业知识。目前已开发的系统包括开源的CropWizard和多种商业系统,均专为解答农学技术问题设计。
AIFARMS项目下的CropWizard正在开发创新的基准测试方法,以实现对此类服务的高度信任。这些组织的数据集和软件工具为构建基于专家验证的评估体系提供了基础。