计算机视觉

计算机视觉是一个跨学科的科学领域，研究如何让计算机从数字图像或视频中获得高水平的理解。从工程学的角度来看，它寻求人类视觉系统能够完成的自动化任务。计算机视觉任务包括获取、处理、分析和理解数字图像的方法，以及从现实世界中提取高维数据以便例如以决策的形式产生数字或符号信息的方法。在这查看详情>种背景下，理解意味着将视觉图像(视网膜的输入)转化为对世界的描述，这种描述可以与其他思维过程相结合并引发适当的行动。这种图像理解可以被看作是利用借助几何、物理、统计和学习理论构建的模型从图像数据中分离符号信息。

计算机视觉

多模态理解生成“大一统”！Meta&amp;港大等重磅发布Tuna：统一视觉表征，性能碾压Show-o2

全球智慧视觉检测系统市场销售额预计将攀升至 253.1 亿元的惊人规模

黑芝麻智能SesameX,重建机器人「该如何计算」的底层结构

没有地图，纯视觉自动驾驶就只能摸瞎吗？

自动驾驶教父Thrun预言，纯视觉路线决胜2026，空中机器人将成新蓝海

算力“华山论剑”：开放协同，能否为中国计算弈出未来？

第二弹！MIT何恺明团队再发重磅成果VARC：ARC原来是个视觉问题！性能匹敌人类水平

字节跳动推出Mini-o3：视觉推理比肩OpenAI o3

阿里最新视觉语言模型 Qwen3-VL：明察、深思、广行

DeepMind 发表 Veo 3 论文：视觉推理领域的 GPT-3 时刻来临！

Meta 与牛津大学合作论文：从语言预训练中揭开 LLM 视觉先验的起源

AMDQ3业绩爆发：AI与高性能计算的红利！

双语理解视觉模型 360 FG-CLIP2：登顶全球最强图文跨模态模型

自动驾驶中如何将稀疏地图与视觉SLAM相结合？

通用计算时代已经结束！黄仁勋深度访谈，首次揭秘投资OpenAI的原因

英伟达1000亿美元投资OpenAI，人类超级计算资源正走向垄断

VLA模型能帮助纯视觉自动驾驶走向成熟吗

掘金AI时代计算产业红利的商业伙伴，为什么跟华为组队？

L4自动驾驶是否必须依赖激光雷达，纯视觉是否足以胜任 ？

字节视觉大模型人事变动：负责人杨建朝官宣内部休息，周畅接任

自动驾驶纯视觉方案到底有哪些弊端？

一文看懂视觉语言动作模型（VLA）及其应用

深圳机器人视觉传感器独角兽冲刺IPO，机器人正排队IPO

量子计算大战正酣，中国提前布局这一关键领域

【宝德计算机】参与“维科杯·OFweek 2025（第十届）人工智能行业年度评选”

赋予大模型“眼睛”：视觉语言模型带来全新的可能

台北国际电脑展首日观察：AI PC占C位、边缘计算要普及？

迈向人类级驾驶智能：VLA视觉语言的行动模型

嵌入式视觉，规模化部署与多模态技术进步正驱动产业变革

芯片到系统：MPS如何赶上计算、汽车与能源的转型浪潮？

汽车数字孪生：边缘计算带来更好的智能驾驶应用场景

高速数据传输：构建嵌入式视觉的未来

解码 | 研华嵌入式核心优势，以Edge Al驱动机器视觉升级

AI视觉芯片在智慧安防领域应用潜力巨大 2024年我国销售额同比增长超过20%

光计算迎来商业化突破，但落地仍需时间

AI战略两年后，云计算厂商走到哪了？

从边缘端到中心端，海康威视视觉大模型落地交通行业

视觉大模型落地应用，海康威视发布系列大模型摄像机

自动驾驶中大受追捧的纯视觉方案到底有何优势？

多模态大模型持续落地！海康威视推出文搜计算系列产品

多模态理解生成“大一统”！Meta&港大等重磅发布Tuna：统一视觉表征，性能碾压Show-o2

L4自动驾驶是否必须依赖激光雷达，纯视觉是否足以胜任？