明发彩票 - 明发彩票
明发彩票2023-01-31 16:05

明发彩票

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

当“地上的5G”遇上“天上的北斗” 这个万亿市场按下启动键******

  工业和信息化部的最新数据显示,截至2022年9月末,我国5G基站总数已达222万个,占全国移动基站总数的20.7%,占全球5G基站总数的60%以上。

  最新发布的《新时代的中国北斗》白皮书指出,中国的北斗系统已成为面向全球用户提供全天候、全天时、高精度定位、导航与授时服务的重要新型基础设施,北斗已经是世界一流的卫星导航系统。

  虽然最大的5G和一流的北斗,已经足够激动人心。但如果当“地上的5G”与“天上的北斗”握起手来,又将会展开一幅怎样的未来画卷呢?

  “一个令产业兴奋、令百姓憧憬的万亿市场已经按下启动键。”国际欧亚科学院院士、北京邮电大学教授邓中亮在接受《中国经济周刊》采访时如是总结:天地一体、时空一体、通导一体的网络基础设施将会给人类带来巨大的经济和社会价值,中国应该也有能力走在全球前列。

  5G+北斗是“天生一对”,让两大“大国重器”强强联手

  我国先后建成全球最大的4G网络和5G网络,和4G相比,5G应用场景会有很大差别,但也面临着新的挑战。

  例如在重点应用方向之一的工业互联网领域,要建成智慧矿山、智慧矿井,要实现公路网、铁路网的全覆盖,都需要保证室内、高山、深谷等遮蔽和半遮蔽空间的信号覆盖,且信号不易被干扰。而在智慧交通、无人驾驶等场景,会要求通信网络在满足通信需求的同时,不仅拥有高精度时空感知能力,能通信,也要能定位。

  从建设北斗到应用北斗,从中国的北斗到世界的北斗,从天上的北斗到身边的北斗……能够实现室内的精准定位是中国北斗在技术上超越GPS等其他卫星导航系统的重要优势之一,这个在“最后一米”上的技术突破意义重大,也将会带来应用场景和产业发展上诸多新的可能性。

  在邓中亮看来,可以将“5G+北斗”作为抓手,推动通信与导航的深度融合,实现能通信就能高精度定位。二者的融合可以满足全覆盖、高精度需求,相互赋能,彼此增强。

  “5G是地上的网,北斗是天上的网,5G解决数据高速传输和卫星遮蔽区域高精度定位问题,北斗解决高精度授时和开阔空间高精度定位问题,5G+北斗的融合不仅可以相互赋能,还能够带来海量的高精度、高时效的地理大数据。”邓中亮说。

  中国卫星导航系统管理办公室主任、北斗卫星导航系统新闻发言人冉承其也曾用“天生一对”来形容5G和北斗。“5G对时间和位置提出更高要求,而卫星导航系统能够提供更高精度的位置和时间信息,因此,5G和北斗卫星导航系统具有天然融合性。”他说。

  实际上,早在2006年,科技部就启动了“羲和”计划,旨在构建天地一体的时空定位系统。作为“羲和”计划室内导航系统的主要负责人和学术带头人,邓中亮和团队通过多年攻关,目前已经形成几百项自主知识产权和一系列关键技术。

  据邓中亮介绍,“羲和”计划有两个重要目标,一是提高卫星定位的性能和精度,令其服务能力越来越强;二是实现通信信号从室外到室内的定位全覆盖,复杂环境下也能保持服务能力。

  “北斗+5G融合发展是必然的,这两项‘大国重器’强强联手,将惠及国防军事、智慧城市、自然资源、通信网络、交通、电力等各行各业,带来无限可能。”邓中亮说。

  当地上的通信网络与天上的卫星网络实现“通导一体”,通俗地说,就是无论何时何地都有信号,告别“不在服务区”;还要能随时随地实现精准定位导航,哪怕是高山大海,哪怕车库深井,都能实现精准到米甚至亚米级别的导航。

  通信与导航深度融合,“没那么简单”

  基于“5G+北斗”的通信技术与精准时空技术的融合及应用,将是这些领域基础设施信息化、智能化升级改造不可或缺的重要基础设施。

  当然,还有一个更为重要的要求,那就是要通过自主创新,不被人“卡脖子”,发展和建设好一个中国自主可控的、全空域、全时域、全频域、高精度、高可靠、高可用的时空体系。

  邓中亮认为,北斗+5G融合可以从三个层面来理解。一是北斗可支撑5G网络安全高效运行。比如为5G提供高精度授时与同步、百万基站管理等服务,为5G网络应用提供精准的定位导航应用,开拓基于高精度时空基准的通信业务等。

  二是5G可增强北斗导航服务能力。比如5G自身可实现优亚米级的定位能力,这意味着可与北斗形成信号覆盖互补,从而实现从室外到室内、从地面到地下无缝隙衔接与定位,支撑全空域全时域定位导航服务。而5G网络本身又可成为支撑位置服务业务的通信通道。

  三是北斗+5G深度融合,将形成泛在、无缝、高精度、高可信的PNT(即Positing定位、Navigating导航、Timing授时)体系,横向无缝覆盖室内、纵向拓展到水下及深空,且能在复杂环境下提供高精度、连续稳定的时空信息服务,进而服务智慧城市、无人系统、万物互联等多个场景。

  理论逻辑虽然很好理解,但真正实现通导融合却“没那么简单”,需要解决一系列技术难题。“比如,5G和北斗是不同的信号,每个信号都会有‘噪声’,要想实现和睦相处,既能各干各的事,还可以相互增强,并不容易。”邓中亮说。

  邓中亮教授带领团队研制的“羲和”系统,提出了TC-OFFEND定位与通信融合的新型信号体制。依靠这种技术,有效节约了室内定位成本,把移动通信网变成了一张既能通信的网,又能高精度定位的网。

  而且更为重要的是,这套系统并不需要新增大量的成本投资,比如通过“隐嵌信噪”技术解决不同的信号“噪声”问题,只需要一块小小的芯片就可以实现,新增的投入成本极低。

  《中国经济周刊》首席摄影肖翊|摄

  从技术到产业,万亿级市场按下启动键

  当然,看到通导融合这一发展趋势的不只是中国。美国也很早就将发展定位导航授时一体的PNT体系上升至国家战略的地位,以弥补原有GPS系统的问题和不足。但除了技术上较量,通导融合“哪家强”,最终还是要在应用上见真章。

  “我国建成覆盖4G网络,投资规模超过6000亿元,5G网络的投资规模更是超过了1.2万亿元,但也只能覆盖我国的人口密集区域。而北斗卫星实现全球覆盖投资规模约为600多亿元。我国的5G网络建设投资巨大,也需要在更多的应用场景下寻找更多的商业模式,从而让其为经济社会的发展创造更大的价值。”邓中亮介绍说。

  但在邓中亮看来,实验室里的技术创新突破只是第一步,要想让“5G+北斗”产生更大的经济社会价值,需要社会各方面的通力合作,推动商业模式创新和产业化进程,共同挖掘。

  《新时代的中国北斗》白皮书也指出,截至2021年,中国卫星导航与位置服务总体产业规模达到约4700亿元,年均复合增长率超过20%。中国北斗广泛应用于经济社会发展各行业各领域,进入交通、能源、农业、通信、气象、自然资源、生态环境、应急减灾等重点行业。中国北斗与大数据、物联网、人工智能等新兴技术深度融合,催生“北斗+”和“+北斗”新业态,支撑经济社会数字化转型和提质增效。

  而多家第三方机构预测,按照目前北斗系统的产值增加速度,预计2025年其产业规模有望达到万亿元。来自高德地图的数据也显示,截至2022年11月,高德地图调用北斗卫星日定位量已超过2100亿次,且在定位时北斗的调用率已超越了GPS等其他卫星导航系统。

  邓中亮表示,实际上,智慧物流、智慧医疗、智慧城市、智慧交通、工业互联网、智慧农业……北斗已经发挥着巨大的作用。以重点和焦点所在的工业互联网领域为例,这本身就是一个万亿级别的大市场,特别希望有更多有志之士将北斗和5G与人工智能、新兴技术等融合,发展出更多新兴产业,创造更多新的商业模式,为经济发展带来新的增长点。

  已经有先行者尝到了甜头。以全国北斗卫星导航应用三大示范区域之一的湖南长沙为例。据长沙市人民政府副市长彭涛在“2022北斗规模应用高峰论坛”上透露,在长沙,北斗技术已成功应用到智能驾驶、驾考驾培、桥梁监测、野生动物追踪、水路安全、防灾减灾、司法、邮政运输、工程机械、公共安全等诸多领域。

  长沙正在加快推动“北斗+5G”在智能网联汽车领域应用示范,通过5G网络融合北斗卫星导航系统定位技术,长沙的电动智能网联汽车能够对车辆进行高精度厘米级定位,为自动驾驶进行定位护航。目前,这套系统已在全国400多个城市上千个驾考场地中投入使用。驾考中,车辆是否压线、靠边停车是否在规定范围内,都能轻松判定。

  “力争到2025年,长沙市北斗及相关产业规模突破500亿元,其中北斗核心产业规模突破200亿元,创建省级先进制造业集群,力争创建先进制造业集群。”彭涛说。

中国网客户端

国家重点新闻网站,9语种权威发布

明发彩票地图