您的位置首页  健康

环境与健康杂志_环境与健康学

  • 来源:互联网
  • |
  • 2025-03-06
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字


我们正处在一个信息数字化与数据处理技术突飞猛进的时代如今,廉价传感器和高精度仪器让数据采集更高效,而实验记录本早已被电子表格取代;数据处理技术方面,机器学习技术已

环境与健康杂志_环境与健康学

 

我们正处在一个信息数字化与数据处理技术突飞猛进的时代如今,廉价传感器和高精度仪器让数据采集更高效,而实验记录本早已被电子表格取代;数据处理技术方面,机器学习技术已经进入了自动化阶段,大语言模型也可以直接给出数据处理的代码甚至结果。

大数据配合人工智能的技术趋势配合开放科学数据分享的研究趋势,为环境健康研究带来大量的数据驱动的研究机遇然而数据伦理问题也在日益显现, Environment & Health 最近的一篇来自中美学者的观点文章就环境健康相关的数据伦理问题进行了讨论。

Ethical Frameworks for Data-Driven Environmental Health Studies in the AI Erahttps://pubs.acs.org/doi/10.1021/envhealth.4c00273

数据收集:如何保证公平与隐私?环境健康数据不可避免会涉及人体样品与环境监测数据第一个为数据收集把关的机制是机构审查委员会(IRB)或者独立伦理委员会(IEC)研究人员在获得基金资助后需要向所在研究研究机构提交研究计划,由研究机构自己组织的委员会来审核备案,用以保护研究对象的隐私、健康和福祉。

这一机制的一个起源是塔斯基吉梅毒实验,实验中非洲裔受试者未被告知自己患有梅毒,也未接受有效治疗,导致严重的伦理争议国内与之相关的是贺建奎案,其研究就存在伦理审查上的问题需要注意的是,即使研究计划的伦理审查通过,后续实验进程也是要受伦理审查监督的,有问题要尽早解决。

进入数据收集阶段,最基本的数据伦理就是知情同意,也就是要获得数据来源方的授权这个要求在当前尤为重要,因为现在很多样品分析技术并不预设研究目标,而是尽可能多采集数据中的生物信息,而数据在被分享后也会被其他研究人员进行二次挖掘,如果没有合适的授权,很容易侵犯个人隐私。

例如,美国国立卫生院目前就强制要求基因组数据在共享前一定要拿到个人授权,因为通过基因组信息是可能定位到具体的人甚至家族关系的数据的使用许可最好在数据收集阶段就确定,要明确标注数据本身知识产权的归属,避免滥用。

另外数据收集阶段也要考虑公平性研究人员需关注数据的代表性,避免数据采集阶段就存在偏差例如,在进行空气污染与健康的研究时,如果数据主要来自城市地区,而农村数据较少,则人工智能模型可能会对农村人群的风险预测不准确。

最后需要关注的是公众科学的数据问题现在很多环境研究受益于公众科学,很多环境研究也使用了这部分数据然而,由于公众科学的门槛低,数据质量可能参差不齐,数据原始记录可能不完善或过于完善导致隐私泄露,这些都是环境健康研究人员需要谨慎对待的。

数据分析:如何避免算法偏见?数据分析是环境健康研究的核心环节,包括数据预处理、统计分析、模型训练和预测等数据预处理一般会用唯一性编号取代含有个人信息的内容,如果研究更多关注描述性统计或不对个人层面进行统计推断或非时序数据,可以进行数据杂交,这样可以保证信息量不变,但不会影响研究结论。

这里数据杂交可以这样理解,医院有一组患者数据,比如A患者身高175cm、体重70kg,B患者身高160cm、体重60kg为了保护隐私,医院可以把身高和体重随机匹配不同个体,让训练模型时看不到真实身份,但整体数据分布不变。

进入数据分析阶段后,则要尽量保证全过程算法透明,研究人员应记录使用的软件、分析方法、超参数优化过程,并公开相关代码,以确保结果的可复现性这里要尽量使用那些记录操作步骤的数据分析软件或直接使用高级编程语言(例如R或Python)脚本,因为很多软件同一项分析的默认选项是不同的。

例如常见的方差分析,在计算平方和时 R 里是 Type I,python 是 Type II,SAS是 Type III如果没有这些记录,其他研究人员在使用同一组数据进行复现时就会出问题在人工智能流行的当下,很多机器学习的模型属于黑箱模型,而有些研究则喜欢通过迁移学习来继承预训练基础模型的框架与参数进行定向训练或微调。

在这一过程中,基础模型里存在的算法偏见可能会被继承到新的模型里,因此研究人员有义务去评价基础模型的偏向性同时,研究人员也可采用可解释AI(Explainable AI, XAI)方法,如Grad-CAM或注意力可视化,以提高模型的透明度和可信度。

另外,很多数据分析模型虽然是技术中立的,但却可能有不同的用途例如用来发现具有公共健康威胁的新兴污染物的技术也可以用来做化学武器,因此这些数据模型的推广与应用需要谨慎,多考虑不同学科背景研究人员的意见与建议。

数据分析本身的能耗也可能会逐渐成为一个不可忽视的议题大语言模型的一次训练耗电量与中小城市的一天耗电量相当,环境健康相关数据体量远大于语言模型数据量,可以预想一个具备城市尺度环境健康预警能力的模型训练能耗也会很高。

在碳中和大背景下,数据分析也需要考虑能耗及其优化问题数据共享:如何平衡开放与安全?环境健康数据越来越被视为一种公共资源,许多科学期刊和资助机构都鼓励数据开放共享然而,数据共享也带来了隐私保护、知识产权和安全性等伦理挑战。

一个基础原则就是FAIR,也就是数据应符合可查找(Findable)、可访问(Accessible)、可互操作(Interoperable)、可重用(Reusable)的FAIR原则,以促进科学透明度和合作。

另外就是为了保护隐私,个人信息是必须去除的,甚至分享时要采用隐私保护计算等措施防止再识别可以用同态加密(Homomorphic Encryption)技术,就像给数据加上一把智能锁,服务器虽然能计算它,但却看不懂内容。

这保证了数据隐私,同时还能允许数据二次挖掘数据的分享要有明确的使用许可,确保数据不被滥用,也能一定程度标注数据分享者的贡献而数据分享的目标平台因学科而异,但基本都需要一定的数据安全资质且有明确的权限管理机制。

另一种数据比较特殊,就是由人工智能生成的数据,甚至有些模型的训练就是由合成数据来完成的这类数据的分享一定要标注数据来源,这类数据一方面有利于模型验证,但另一方面也存在滥用风险,甚至可能专业人员也无法分辨来源,使用这种数据的伦理风险需要考虑。

总之,数据相关技术的进步即是研究机遇,也需要警示其中的伦理风险在人工智能大流行时代,环境健康研究人员需要保持持续学习新技术的开放性心态,研究机构也应定期对科研人员进行数据伦理的培训毕竟,在前沿研究中,技术发展往往快于伦理规范,因此研究人员的自律和机构的持续培训至关重要。

科技向善,才能真正造福环境与健康。作者团队介绍

于淼,中科院生态中心环境科学理学博士,在加拿大滑铁卢大学和美国西奈山伊坎医学院分别做过博后, 目前在美国杰克逊实验室担任副计算科学家,研究方向为质谱数据分析与暴露组学(最值得一提的是)是首期E&H青年编委团队一员。

方明亮,复旦大学环境科学与工程系教授, 本科、硕士、博士先后毕业于西安交通大学、韩国浦项工业大学、美国杜克大学,曾在The Scripps Research Institute代谢组学中心从事博士后研究和新加坡南洋理工大学担任终身轨教职。

目前实验室主要课题方向为暴露组学和环境健康,利用系统生物学方法研究污染物毒性机理研究成果以第一或者通讯作者发表在Nat Nanotechnol、Nat Chem Biol、PNAS、Environ Health Perspect、Environ Sci Technol 、Anal Chem等100余篇。

2021年开始担任环境领域权威期刊 Environmental Pollution 副主编,ESTL、Environ Int、ACS ES&T Water、RSC Environmental Science: Processes & Impacts 等多个杂志编委。

曾获得海外高层次人才引进、2023年度美国化学协会 ACS Chemical Research in Toxicology 年轻科学家奖、环境化学大会青年奖、 “小米”首届青年学者等,受邀国际知名协会Gordon Research Conference专题会议特邀报告。

王斌,长聘副教授/研究员,北京大学生育健康研究所/北京大学城市与环境学院(兼聘)研究方向:环境健康、暴露组学、人工智能主持国家自然科学面上和青年基金4项,骨干参与国家重点研发项目3项以第一或通讯作者在Environ Health Persp、Environ Sci Tech、The Innovation等国际权威期刊发表长篇论文,以及在Science、Environ Sci Tech、The Innovation期刊应邀发表观点性评述论文,共60篇(H指数=45,他引6000余次)。

担任环境健康领域TOP期刊Environ Sci Tech副主编开设本科生和研究生教改课程“暴露组学”,全球健康国际高端公共卫生硕士课程“Environment & Health”担任中国队列共享平台“环境与人群健康”组长,环境诱变剂学会环境与生育健康专委会副秘书长。

获得北京预防医学会科技二等奖、华夏医学科技奖三等奖和“全国科技系统抗击新冠疫情优秀个人”称号 E&H关于Environment & HealthEnvironment & Health(《环境与健康》)

由美国化学会(ACS)和中国科学院生态环境研究中心(RCEES)合作出版作为一本国际化、高质量的开放获取期刊,Environment & Health致力于揭示环境暴露与人类健康之间的关系,探索潜在的公共卫生影响,为可持续发展和建立更健康的世界构建一个高水平国际学术交流平台。

期刊聚焦不断变化的有害环境因素对人类健康的影响,重点报道具有重要意义的高水平原创研究,以及与环境和健康政策相关的创新理念期刊将发表Research Article、 Review、Policy Analysis、Perspective和Viewpoint等多种类型文章。

所收稿件将经过严格、快速的同行评审Editor-in-Chief: Guibin JiangExecutive Editor: Qian Liuhttps://pubs.acs.org/EnvHealth

开放投稿:2023年2月首期上线:2023年7月Environment & Health入选2022年中国科技期刊卓越行动计划高起点新刊Indexed/Abstracted:Web of Science ESCI, CAS,Portico,Scopus,DOAJ, PubMed Central。

Copyright © 推文版权为Environment & Health编辑部所有转载请后台私信

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186