博客
关于我
Apache IoTDB源码解析(0.11.2版本):基本的数据结构解析(iotdb的内存表、存放的值)
阅读量:346 次
发布时间:2019-03-04

本文共 628 字,大约阅读时间需要 2 分钟。

IoTDB内存表模型与源码分析

1. 声明

本文旨在分享学习IoTDB源码的经历和收获,重点探讨其内存表的数据结构设计。所有内容源自于GitHub直接拉取的IoTDB开源项目源码。

2. AbstractMemTable源码分析

IoTDB采用HashMap作为内存表的基础数据结构,key为devcId(表示某个时序的前缀),value为另一个Map,用于存储时序后缀、时间戳集合以及数值集合。这种设计使得数据能够按照特定规则组织和检索。

3. IWritableMemChunk及子类源码解读

IWritableMemChunk类是IoTDB内存写入功能的核心实现,包含两个主要属性:MeasurementSchema(用于存储测点定义)和TVList(用于存储时序数据)。该类提供两种写入方式:单个数据写入和数组批量写入,分别通过相应的方法实现。

4. TVList及其子类分析

TVList位于org.apache.iotdb.db.utils.datastructure包下,作为时间序列数据的基础存储和排序接口。其子类BinaryTVList通过特定算法实现数据存储和索引计算,确保高效的时序数据管理和快速访问。

5. 内存表设计总结

IoTDB采用 HashMap管理内存表,devcId作为键,存储时序后缀及相关数据的Map作为值。TVList及其子类负责时序数据的存储和排序,通过两份数组分别管理时序和数值索引,确保数据的高效性和完整性。

转载地址:http://zcrh.baihongyu.com/

你可能感兴趣的文章
Pandas 的 DataFrame 详解-ChatGPT4o作答
查看>>
pandas 读取excel数据,以字典形式输出
查看>>
Pandas 读取具有浮点值的 csv 文件会导致奇怪的舍入和小数位数
查看>>
pandas 适用,但仅适用于满足条件的行
查看>>
pandas 重新采样到每月的特定工作日
查看>>
pandas :如何删除以NaN为列名的多个列?
查看>>
pandas :我如何对堆叠的条形图进行分组?
查看>>
pandas :按移位分组和累加和(GroupBy Shift And Cumulative Sum)
查看>>
pandas :检测一个DF和另一个DF之间缺失的列
查看>>
Pandas-从具有嵌套列表列表的现有列创建动态列时出错
查看>>
Pandas-通过对列和索引的值求和来合并两个数据框
查看>>
pandas.columns、get_dummies等用法
查看>>
pandas.DataFrame.copy(deep=True) 实际上并不创建深拷贝
查看>>
pandas.read_csv()的详解-ChatGPT4o作答
查看>>
PANDAS.READ_EXCEL()输出‘;溢出错误:日期值超出范围‘;而不存在日期列
查看>>
pandas100个骚操作:再见 for 循环!速度提升315倍!
查看>>
Pandas:如何根据其他列值的条件对列进行求和?
查看>>
Pandas:对给定列求和 DataFrame 行
查看>>
Pandas、Matplotlib、Pyecharts数据分析实践
查看>>
Pandas中文官档 ~ 基础用法1
查看>>