向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
减负,让干部群众增添获得感******
隆冬的陕北黄土高原,天空湛蓝。刚刚参加了一场重点工作安排部署会的陕西省神木市店塔镇店塔村党支部书记倪志林,驱车直奔大棚草莓园。
“过去镇里每周至少组织我们村干部开一次会,也不是每次都有需要现场传达的事情,跑来跑去浪费不少时间。”倪志林说,刚开完的这次重点工作安排部署会新风扑面,干部作风建设、安全生产、巩固拓展脱贫攻坚成果同乡村振兴有效衔接等工作一并部署安排,“这在以前可是要分别开会的,如今多会合一效率高,留给我们抓落实的时间更充足了。”
2019年4月,陕西省委印发《解决形式主义突出问题为基层减负十条措施》,省纪委监委把为基层减负融入纪检监察工作各环节,下功夫解决“庸懒散慢虚浮粗”等作风顽疾,推动党中央决策部署落地见效。近年来,陕西省共查处形式主义、官僚主义问题14186件,处分15913人,有效推动解决了政绩工程、形象工程易发多发,文山会海、检查过多等困扰基层的突出问题。
精简文山会海,腾出时间精力抓落实
2022年12月27日,汉中市西乡县私渡镇微信工作群发布了一项优抚对象自然减员登记任务。红安社区第一书记舒泽统计后直接通过微信群上报,用时不过5分钟。“以前此类工作必须以正式文件的形式加盖公章层层上报,一折腾就一两天。现在很多工作动动手指就处理好了,高效又便捷。”舒泽说。
纠“四风”树新风,为基层减负是重要抓手。陕西省将整治形式主义为基层减负列入工作方案、纳入省委巡视,着重整治文件、会议明减暗不减,“指尖上的形式主义”、政绩工程、形象工程易发多发,文山会海、检查过多等突出问题。
“多头、层层要求下级报材料或报表,不仅没有必要,还会让本就人手紧缺的基层负担加重。”西安市莲湖区委常委、纪委书记周兴鹏深有感触地说。
为了根治备受基层“诟病”的重复报送问题,莲湖区纪委监委打通壁垒实现了信息跨部门共享,对于全区纪检监察系统可以合并报送的文件,由一个部门牵头收集;同时还破除“唯红头文件”的思维模式,鼓励各单位通过邮箱、公文传输系统等渠道报送文件,让信息“多跑路”,干部“少跑腿”。
西乡县则通过设置基层监测点,掌握动态信息,推动基层负担问题专项治理走深走实。通过镇级基层监测点,每月收集整理收文、参会、督考等监测信息,开展减负效果评估分析,了解全县各部门单位发文、开会、检查情况;每半月前往村级基层监测点了解村级组织工作情况,及时准确掌握基层负担动态。每月对发文多、会议多、检查多排名前三的县级部门发送提醒函,给已发送提醒函的部门提出工作建议,纠正出现的问题和偏差,对连续3个月排名前三的部门提请领导小组进行约谈。
“通过基层监测点的反馈,掌握基层负担情况,从而有的放矢安排工作,做到文件可发可不发的坚决不发、能合并发文的坚决合并、已作出部署的不再发文。”西乡县纪委监委有关负责人说。
西乡县纪委监委还会同县妇联合并发文部署家风建设、会同县财政局合并发文部署“一卡通”专项治理、会同县委组织部合并发文安排村监委会主任报酬落实……“文件少了,分量重了。合并发文有效避免了基层互相推诿的问题,执行力也更强了。”西乡县沙河镇纪委书记胡玉荣说。
“精文”的同时,西乡县统筹将需要乡镇、街道领导干部召开的会议尽量放在周一、周五,提倡召开视频会议,为干部腾出更多抓落实的时间精力。专项治理以来,基层接收文件、参加会议同比分别减少25%、16%。
作风建设专项行动开展以来,陕西省严格文件、会议把关审核,持续抓好省直部门单位发文、开会数量的计划管理和动态监测。数据显示:2022年7月以来,省级层面印发文件1147件,同比下降9.1%;召开会议211次,同比下降9.8%。
避免督查检查考核“雨点乱下”,让工作更务实高效
“每次迎检,都要安排专人准备一大堆印证资料、安排会议室、打印桌牌,为此耗去三四天时间是常事儿。”在安康市旬阳市民政局工作人员小刘看来,“迎检”就等于“加班”。
2022年3月,旬阳市纪委监委印发纠“四风”树新风实施方案,将检查考核过多、过度留痕、“指尖上的形式主义”等加重基层负担问题纳入重点监督范围,并带头执行。当月,市纪委监委便采用“四不两直”方式,将疫情防控、粮食领域巡察“回头看”、一季度重点项目建设3项督查合并为1次综合督查,避免了检查不断、督查“扎推”问题。
“自从整合监督检查项目、改进监督检查方式后,我们轻松多了,只需要准备好日常工作台账及重要资料即可。”甘溪镇党政办工作人员感叹道。
为求实效,旬阳市纪委监委在制定2022年度全市党风廉政考核方案中,仅保留“主体责任纪实”考核需查看资料,其他考核事项均以走访、调查、座谈等形式进行,既为各单位省下了推进工作的时间,也让考察结果更客观准确。
规范督查检查考核工作,必须严格控制总量。为此,宝鸡市出台规定要求各单位将“督检考”事项列入年度计划,计划外事项原则上不再开展,确须开展的要提前一事一批。
“宝鸡通过加强督促检查,形成工作闭环,推动基层减负各项重点任务落细落实。”宝鸡市委副秘书长、市委正县级督查专员景行军介绍,宝鸡出台了《推进十项重点任务分工方案》《抓落实工作机制要求》,建立通报考核、问题销号等机制,有效避免重复发文、层层开会,切实把广大干部精力凝聚到重点工作和项目一线。
“陕西加强对省级督查检查考核的统筹,严格执行年度计划,省级部门单位根据工作需要每年最多开展1次综合性督查检查,新增督查检查考核事项必须严格履行报备程序。”陕西省委办公厅督查室有关同志介绍。
自2021年开始,陕西省紧盯实践中存在的基层监督泛化问题,各级纪检监察机关督促党委政府加强对督查检查考核的统筹,坚决纠治庸懒散慢、虚于应付、执行政策层层加码或简单机械“一刀切”等问题,对执行政策简单粗暴、机械刻板、搞形式走过场等27个具体问题进行督办。
为基层减负松绑,激发干部干事创业积极性
“您看着我的手机,现在点点头,对,再张张嘴……”2022年4月,安康市石泉县池河镇新兴村村委会副主任廖小铁骑着摩托车,在山路上跑了半个多小时,来到低保户陈泽勋家,只花了10多分钟便帮他完成了养老保险、高龄补贴、计划生育补贴3项生存认证。
此前,为村民进行生存认证,是包括廖小铁在内的全县110个村社干部最头疼的事。
原来,3项惠民资金的生存认证对象有不少重叠,认证工作启动的时间又不一样,加上农村高龄老人大多不会使用智能手机,村社干部只能重复上门或通知老人到村委会进行生存认证。
“村社干部耗费了大量时间在赶路上,群众也得一遍一遍跑,大家心里都有怨气。”廖小铁说。
“这是典型的由于工作统筹不力导致的加重基层负担问题。”石泉县纪委监委一针见血地指出,涉及统筹兼顾,应由上级部门统一思想认识,加强沟通协调,打破信息共享壁垒。
在县纪委监委督促下,石泉县人力资源和社会保障局、县民政局、县卫生健康局3家单位共同成立了“农村老年人生存认证联合工作组”,由分管副县长挂帅,合署办公,统筹安排3项生存认证,集中在同一时段完成,有效减少了基层干部的工作量。
“加重基层负担的形式主义问题种类多样、顽固复杂,我们将坚持问题导向,针对不同领域实际情况,深入调研摸底,为基层减负保驾护航。”石泉县委常委、纪委书记余代根说。
减负,不减责任和担当。这不,新兴村的村委会里,平日只需要留1名村干部值班接待群众,其他村干部则在村党支部书记杨龙的带领下,把精力投入村集体经济项目。争取资金、聘请专家指导、流转土地、雇用劳动力……一个夏天过去了,大家都晒黑了不少。
“我们不怕忙,但怕瞎忙。虽然现在从天亮忙到天黑,但为村里攒下了实实在在的家底。”杨龙想着年底就能给村民分红,心里特别有成就感。
在陕西,越来越多的干部有杨龙这般感受,能够抽出时间精力,投入更加务实的为群众办实事中去。“这让我们更有成就感。”不少干部反映,这是“减”出来的获得感。
基层的酸甜苦辣,基层干部心里最清楚。堵点痛点在哪里,不妨多问问基层干部。
从2021年8月开始,一款名为“长安减负行”的微信小程序很受西安市长安区基层干部欢迎。干部通过小程序反馈基层问题,区纪委监委收到问题后,进行分析研判,形成处置建议,对问题反映集中的,成立核查组进行核查;对一般性问题,向相关部门下发督办单等督促整改。
“小程序为基层干部建立了畅通的意见建议反馈渠道,让相关部门更精准地了解基层干部的难处,有针对性地为基层松绑减负,激发干部干事创业积极性。”长安区纪委副书记、监委副主任贾炜说。
此外,为提升减负成效,陕西省纪委监委紧盯形式主义、官僚主义突出问题并定期公开曝光典型问题,下功夫解决“庸懒散慢虚浮粗”等作风顽疾。同时,印发《精准规范问责政策研究与案例分析》学用工作通知,着力纠治问责泛化简单化等问题,防止拿问责基层党组织和干部“顶锅”现象。
“陕西省纪委监委将继续认真贯彻落实党中央、中央纪委、省委关于整治形式主义为基层减负工作安排,强化监督执纪问责,用好‘四种形态’,为整治形式主义为基层减负工作提供坚强纪律保障。”陕西省纪委监委有关负责同志说。(记者 王乐文 龚仕建 张丹华)
(文图:赵筱尘 巫邓炎)