工业互联网时代,我们为什么需要时序数据库之二:适合的就是最好的
在上周的格物汇文章中,我们给大家介绍过,目前国内外主流工业互联网平台几乎都是采用时序数据库来承接海量涌入的工业数据。那为什么强大的Oracle、PostgreSQL 等传统关系型数据库搞不定时序数据?为什么不用HBase、MongoDB、Cassandra等先进的分布式数据库来解决工业数据问题?
作为资深“杠精”,当然需要先知道要“杠”的到底是什么?就时序数据库而言,就是要“杠”两个东西:1、“杠”数据;2、“杠”数据库。
先从数据“杠”起,数据可是一个高深莫测的东西。
想当年图灵用他深邃的眼睛,看穿了世间万物的计算本质:凡是可以计算的,通过迭代,最终都可以表示为0、1的逻辑判断。图灵机需要一个无限长的纸带来表征和记录计算,这无限长的纸带上记录的0、1的组合,就是数据最原始的抽象。图灵机指出了数据的3个核心需求:1、数据存储;2、数据写入;3、数据读取。
可以说,目前所有数据库、文件系统等等,都是为了以最佳性价比来满足数据的这三个核心需求。对时序数据而言,其三个核心需求特征十分明显:
数据写入
时间是一个主坐标轴,数据通常按照时间顺序抵达
大多数测量是在观察后的几秒或几分钟内写入的,抵达的数据几乎总是作为新条目被记录
95%到99%的操作是写入,有时更高
更新几乎没有
数据读取
随机位置的单个测量读取、删除操作几乎没有
读取和删除是批量的,从某时间点开始的一段时间内
时间段内读取的数据有可能非常巨大
数据存储
数据结构简单,价值随时间推移迅速降低
通过压缩、移动、删除等手段降低存储成本
而关系数据库主要应对的数据特点:
(1)数据写入:大多数操作都是DML操作,插入、更新、删除等;
(2)数据读取:读取逻辑一般都比较复杂;
(3)数据存储:很少压缩,一般也不设置数据生命周期管理。
因此,从数据本质的角度而言,时序数据库(不变性, 唯一性以及可排序性)和关系型数据库的服务需求完全不同。
再说说数据库。数据库系统的发展从20世纪60年代中期开始到现在,经历若干代演变,造就了C.W. Bachman(巴克曼)、E.F.Codd(考特)和J. Gray(格雷)三位图灵奖得主,发展了以数据科学、数据建模和数据库管理系统(DBMS)等为核心理论、技术和产品的一个巨大的软件产业(详见下图,资料来源:https://db-engines.com/en/ranking_categories)。

从上图可以得出一个结论,针对不同的数据需求,应该有不同的数据库系统应对之。否则,也没有必要出现这么多种的数据库系统了。
时间序列数据跟关系型数据库有太多不同,但是很多公司并不想放弃关系型数据库。于是就产生了一些特殊的用法,比如:用 MySQL 的 VividCortex, 用 Postgres 的 TimescaleDB;当然,还有人依赖K-V、NoSQL数据库或者列式数据库的,比如:OpenTSDB的HBase,而Druid则是一个不折不扣的列式存储系统;更多人觉得特殊的问题需要特殊的解决方法,于是很多时间序列数据库从头写起,不依赖任何现有的数据库, 比如: Graphite,InfluxDB。

图片新闻
最新活动更多
-
12月15日立即申请试用>> 【免费试用】金升阳助力机器人行业电源国产化
-
即日-12.31立即下载>> 【限时下载】《2025激光行业应用创新发展蓝皮书》
-
1月30日点击报名>>> 【免费试用】宏集运输冲击记录仪
-
即日-4.1立即申报>>> 维科杯·OFweek 2026光学行业年度评选
-
7月15-16日报名参会>>> OFweek 2026中国激光产业高质量发展峰会
-
精彩回顾立即查看>> 费斯托白皮书《柔性:汽车生产未来的关键》
推荐专题
- 1 直击2025 WOD制造业数字化博览会(深圳)
- 2 一屏巡检309个“足球场”?海康威视联合万华化学筑牢安全防线
- 3 基于线共聚焦原理的表面三维测量
- 4 全国首批!海康威视入选领航级智能工厂培育名单
- 5 出席信百会2025年度研讨会,格创东智解锁工业AI从技术探索到智造深耕的路线图
- 6 「OFweek 2025工程师系列在线大会」——半导体技术在线会议,即将火热来袭 !
- 7 省级认证落地,格创东智成为湖北新质生产力崛起的新引擎
- 8 从拣取、检测到量测:Cincoze Din-Rail电脑 (MD-3000) 为机器视觉打造可靠的实时运算核心
- 9 入选“光谷AI新势力”,格创东智展现工业AI强劲领航力


分享














发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论