计算机视觉
计算机视觉是一个跨学科的科学领域,研究如何让计算机从数字图像或视频中获得高水平的理解。从工程学的角度来看,它寻求人类视觉系统能够完成的自动化任务。计算机视觉任务包括获取、处理、分析和理解数字图像的方法,以及从现实世界中提取高维数据以便例如以决策的形式产生数字或符号信息的方法。在这查看详情>种背景下,理解意味着将视觉图像(视网膜的输入)转化为对世界的描述,这种描述可以与其他思维过程相结合并引发适当的行动。这种图像理解可以被看作是利用借助几何、物理、统计和学习理论构建的模型从图像数据中分离符号信息。
-
-
全球智慧视觉检测系统市场销售额预计将攀升至 253.1 亿元的惊人规模
智慧视觉检测系统:技术原理与显著优势 在科技飞速发展的当下,智慧视觉检测系统作为自动化领域的一颗璀璨明星,正凭借其卓越的性能和广泛的应用前景,在全球市场掀起一股强劲的发展浪潮。根据权威调研机构 QYR
智慧视觉检测系统 2025-12-01 -
黑芝麻智能SesameX,重建机器人「该如何计算」的底层结构
作者 |肖恩 编辑 |德新 过去两年,我们已经习惯了各类机器人在科技展、发布会和短视频里频繁出现:会跳舞的人形机器人、能爬楼梯的四足机器人,还有穿梭在商场和园区里的服务机器人。它们从实验室走进公众视野
-
没有地图,纯视觉自动驾驶就只能摸瞎吗?
最近在一篇讨论高精度地图的文章中,有位小伙伴提到一个非常有趣的观点“如果人在陌生的目的地,只依托纯视觉(眼睛)去辨别道路,若没有导航,就只能摸瞎”。对于纯视觉自动驾驶来说,是否也是如此? 图片源自:网
-
自动驾驶教父Thrun预言,纯视觉路线决胜2026,空中机器人将成新蓝海
在摩根士丹利第24届亚太峰会上,自动驾驶领域的“教父级”人物Sebastian Thrun与知名分析师Adam Jonas进行了一场深度对话,内容涵盖自动驾驶技术路线、行业阶段判断、机器人赛道分化、W
自动驾驶 2025-11-24 -
算力“华山论剑”:开放协同,能否为中国计算弈出未来?
11月20日,世界计算大会在长沙开幕。无数双眼睛正在盯着这场盛会,就像盯着英伟达昨天的财报一样。 英伟达创始人兼CEO黄仁勋透露,用于云服务器的GPU产品“已经售罄”。世界对算力的需求还在喷涌。而在世
AI 2025-11-21 -
-
字节跳动推出Mini-o3:视觉推理比肩OpenAI o3
近日,由字节跳动、香港大学团队联合开发的Mini-o3模型正式上线。这个号称Open AI o3 视觉推理平替的视觉语言模型(VLM),在训练限制轮数仅6轮的情况下,能在测试阶段将思考轮数扩展到数十轮
字节跳动 2025-11-17 -
阿里最新视觉语言模型 Qwen3-VL:明察、深思、广行
阿里通义千问于今日正式推出全新升级的 Qwen3-VL 系列——这是迄今为止 Qwen 系列中最强大的视觉语言模型。 Qwen3-VL 在文本理解与生成、感知与推理、上下文长度支撑、与Agent交互中
阿里 2025-11-17 -
DeepMind 发表 Veo 3 论文:视觉推理领域的 GPT-3 时刻来临!
“ 逐帧视频生成与语言模型中的思维链相似。正如思维链(CoT)使语言模型能够用符号进行推理一样,“帧链”(CoF)使视频模型能够跨越时间和空间进行推理。 DeepMind 最新发表的 Veo 3 论文
DeepMind 2025-11-17 -
Meta 与牛津大学合作论文:从语言预训练中揭开 LLM 视觉先验的起源
大型语言模型 (LLM) 尽管仅基于文本进行训练,却意外地能够发展出丰富的视觉先验。这些先验使得模型能够利用相对少量的多模态数据来解锁潜在的视觉能力,从而完成视觉任务。在某些情况下,甚至无需任何图像即
Meta 2025-11-17 -
AMDQ3业绩爆发:AI与高性能计算的红利!
芝能智芯出品 2025年第三季度,AMD交出了一份创纪录的财报:营收首次突破92亿美元,同比大涨36%,净利润达到12.4亿美元,这一季度堪称AMD近几年战略转型的集中成果。 数据中心与AI加速器构成
AMD 2025-11-14 -
双语理解视觉模型 360 FG-CLIP2:登顶全球最强图文跨模态模型
现有的模型在精确对齐视觉内容与语言描述方面的能力仍然有限,尤其是在非英语环境下。模型往往难以捕捉物体属性、空间关系和语言表达中的精细细节,并且对双语理解的支持也有限。 近日,360 发布了 FG-CL
360 2025-11-06 -
自动驾驶中如何将稀疏地图与视觉SLAM相结合?
在自动驾驶场景中,稀疏地图通常是由一系列关键帧和若干三维稀疏特征点构成的地图,每个特征点包含三维坐标和描述外观的描述子;而视觉SLAM是运行在车辆上的实时算法,它一边通过相机估计自身位置,一边在未知环
-
通用计算时代已经结束!黄仁勋深度访谈,首次揭秘投资OpenAI的原因
编辑 重点君 9月26日,英伟达黄仁勋在最新访谈中,就AI行业趋势、计算的未来、英伟达的护城河等话题展开讨论,并首次揭秘其千亿美元投资OpenAI背后的原因。 他认为,摩尔定律失效导致晶体管的成本和能
-
英伟达1000亿美元投资OpenAI,人类超级计算资源正走向垄断
本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。 北京时间周二凌晨,OpenAI和英伟达联合宣布了一份战略合作意向书,计划为OpenAI的AI基础设施部署至少10吉瓦的英伟达系统,英伟
-
-
掘金AI时代计算产业红利的商业伙伴,为什么跟华为组队?
前不久,一个忙碌的工作日上午,“2025华为算力场景发布会暨北京xPN伙伴大会”现场人声鼎沸,前来参观的人群和讨论声络绎不绝。 教育展区内,基于昇腾的AI 实训设备移动机器人,让高校学生快速上手AI开
-
-
字节视觉大模型人事变动:负责人杨建朝官宣内部休息,周畅接任
2025 年 7 月 17 日上午,字节跳动豆包大模型视觉多模态生成方向负责人杨建朝在公司内部宣布 “暂时休息”,相关工作已完成交接。?目前,仍能在字节内部系统中查到杨建朝的信息。 据消息人士透露,杨
字节视觉大模型 2025-07-18 -
自动驾驶纯视觉方案到底有哪些弊端?
随着人工智能与传感器技术的快速发展,自动驾驶汽车逐步走入公众视野。其中,关于感知系统的技术路线选择,始终是大家争论的焦点。尤其是“纯视觉方案”,也就是主要依赖摄像头进行环境感知
-
一文看懂视觉语言动作模型(VLA)及其应用
VLA 应该是自动驾驶以及机器人产业前沿最热的 AI人工智能词语。我们之前文章《2025年,自动驾驶即将开“卷”的端到端大模型 2.0 - VLA (Vision Language Action)》也分享和预言过它是自动驾驶大模型2.0
视觉语言动作模型 2025-06-12 -
深圳机器人视觉传感器独角兽冲刺IPO,机器人正排队IPO
前言: 深圳南山作为国内人工智能和机器人产业的[双高地],在具身智能领域具备两大优势: 其一为坚实的机器人硬件制造基础,其二为丰富多样且广阔的应用场景资源。 &nbs
-
量子计算大战正酣,中国提前布局这一关键领域
量子计算机(quantum computer)是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。广义上,当某个装置处理和计算的是量子信息,运行的是量子算法时,就可称之为量子计算机
-
【宝德计算机】参与“维科杯·OFweek 2025(第十届)人工智能行业年度评选”
维科杯 · OFweek 2025(第十届)人工智能行业年度评选(OFweek 10th AI Awards 2025)由中国高科技行业门户维科网主办、维科网人工智能承办,该评选是人工智能行业内的一大品牌盛会,亦是高科技行业具有专业性、影响力的评选之一
宝德计算机 2025-05-30 -
赋予大模型“眼睛”:视觉语言模型带来全新的可能
芝能智芯出品 视觉语言模型(VLM)正成为人工智能发展的关键节点。通过将大语言模型(LLM)与视觉编码器相结合,VLM 不再局限于传统计算机视觉的封闭任务框架,而是能以自然语言为接口,对图像、视频和文本进行深度理解和灵活生成
-
-
迈向人类级驾驶智能:VLA视觉语言的行动模型
芝能科技出品2025年,由于安全和强监管的作用,辅助驾驶行业正处于黎明前的黑暗。面对复杂的现实路况、多样的人类行为模式,以及传统AI在泛化和理解能力上的瓶颈,理想汽车在《AI Talk第二季》系统性的阐述了“VLA(视觉语言行动模型)”
-
嵌入式视觉,规模化部署与多模态技术进步正驱动产业变革
芝能智芯出品嵌入式人工智能与视觉技术正站在从概念验证走向大规模应用的关键拐点上,2025年嵌入式视觉峰会给大家带来很多的启发。当前两大关键趋势:◎ 其一是嵌入式视觉系统与人工智能从实验室原型
-
芯片到系统:MPS如何赶上计算、汽车与能源的转型浪潮?
芝能智芯出品面对多元化的技术变革,Monolithic Power Systems(MPS)正以持续的研发投入和领先的系统集成能力。在数据中心、汽车电子、人形机器人、音频技术与电池管理等核心领域实现跨
-
汽车数字孪生:边缘计算带来更好的智能驾驶应用场景
芝能科技出品 智能交通的快速发展,汽车数字孪生技术在边缘计算的赋能下,正成为推动未来出行变革的核心驱动力。《汽车数字孪生用例》白皮书深入剖析了该技术在道路交通优化、个性化驾驶辅助及车辆资源共享等场景中的应用
-
高速数据传输:构建嵌入式视觉的未来
市场对高速数据传输的需求正迅速增长。随着智能设备、数据中心系统和软件的发展,企业需要数据在其技术基础设施中快速传输的同时保持适应性、可扩展性和安全性。实时数据传输给系统带来了更大的压力,对基础设施提出了更高的要求
莱迪思 2025-04-23 -
解码 | 研华嵌入式核心优势,以Edge Al驱动机器视觉升级
随着生成式AI的不断演进,AI 在各行各业逐渐展露出巨大潜能。由于 AI 技术的普及在很大程度上依赖于云端大型服务器和高性能算力,这一定程度上限制了 AI 应用的广度与深度。“工业现场对于稳定性、实时性的要求很高,因此企业不可能将现场全部搬到云上
研华科技 2025-04-18 -
AI视觉芯片在智慧安防领域应用潜力巨大 2024年我国销售额同比增长超过20%
国科微正在积极推进边缘AI芯片产品的研发工作,其推出的4K AI视觉处理芯片具备功耗低、延时率低、画质清晰等优势。 AI视觉芯片,又称人工智能视觉芯片,指能够高效执行算法的视觉芯片。AI
-
光计算迎来商业化突破,但落地仍需时间
前言: 尽管DeepSeek的爆火让科技界看到了算力降价的可能性,但科技巨头对人工智能算力的投资并未停下脚步。 目前,光计算技术正逐渐从实验室走向市场,迎来了属于它的“Roadster时刻”
-
AI战略两年后,云计算厂商走到哪了?
如果说此前AI是实验室中的“技术盆景”,2024年则标志着AI进入规模化落地阶段——技术投入与商业回报形成正向循环。 作者|斗斗
-
从边缘端到中心端,海康威视视觉大模型落地交通行业
近日,海康威视视觉大模型在交通场景落地。依托观澜大模型,突破传统算法瓶颈,海康威视在端侧发布新一代事件检测系列摄像机,并在中心端同步部署大模型能力推出事件检测终端、事件检测服务器。从边缘端到中心端大模型,带来智能应用的性能和效果提升,推动交通行业智慧升级
海康威视 2025-03-06 -
视觉大模型落地应用,海康威视发布系列大模型摄像机
进入2025年,依托海康观澜大模型技术体系,海康威视将大模型能力直接部署至端侧,推出一系列视觉大模型摄像机。视觉大模型摄像机不仅成像画质更优,更重要的是突破了场景普适性弱、复杂目标识别难等瓶颈,进一步提升目标检出率,大幅降低误报,在零样本的情况下也能进行识别,检测目标种类更丰富
海康威视 2025-03-05 -
自动驾驶中大受追捧的纯视觉方案到底有何优势?
自动驾驶技术是汽车产业智能化转型的重要方向,也是全球科技企业和传统车企竞相角逐的技术高地。在实现自动驾驶的技术上,感知系统作为自动驾驶汽车的“眼睛”,决定了其对环境的理解能力。感知系统的发展路径大致分为两类:激光雷达主导的多传感器融合方案和完全依赖摄像头的纯视觉方案
-
多模态大模型持续落地!海康威视推出文搜计算系列产品
近期,多模态大模型又一新品重磅来袭,海康威视基于观澜大模型技术体系推出边缘到中心全覆盖的文搜计算系列产品——文搜超脑、文搜主机。输入一句话或一个词就可以实现高效检索及实时预警,识更多、搜更准、应用更灵活,助力千行百业安防业务管理提智增效
海康威视 2025-02-24
最新活动更多 >
-
12月9日立即报名>> 恩智浦创新技术峰会
-
12月15日立即申请试用>> 【免费试用】金升阳助力机器人行业电源国产化
-
深圳专场立即报名 >> 12月16-17日 AMD 嵌入式峰会
-
12月19日预约直播> OFweek 2025锂电池“零缺陷”生产技术在线峰会
-
12月19日立即报名>> 【线下会议】OFweek 2025(第十届)物联网产业大会
-
即日-12.25点击申报>> 维科杯·OFweek 2025(第四届)储能行业年度评选

