opensource4you / astraea

釋放kafka的無限潛能
Apache License 2.0
125 stars 45 forks source link

[EXPORTER] 支援寫入 metadata 在備份文件尾部 #1830

Open Haser0305 opened 1 year ago

Haser0305 commented 1 year ago

exporter 在未來可以支援壓縮備份的功能,因此需要有 metadata 的搭配可以判斷檔案類型,並且供未來的 importer 可以靠 metadata 增加更多功能的可能性。

以目前的 exporter 架構來說,比較不方便在創建 recordWriter 的時候帶上一些額外資訊,如 connector name, compression type 等資料,並且 outputStream 的傳遞如果是在有壓縮的狀況下,會不好處理針對 metadata 不壓縮寫入的處理。

預計包含的 metadata

預計達到的目標

chia7712 commented 12 months ago

不好意思,可否協助補上有哪些資訊可以放在metadata?謝謝

Haser0305 commented 12 months ago

好的,那我編輯一下補充 metadata 資訊

Haser0305 commented 11 months ago

補充一下當下作法的規劃,metadata 資料應該會固定為 552 Bytes connector name 跟 topic name 會將長度以空白補充到固定長度。

chia7712 commented 11 months ago

@Haser0305 請問會放版本號嗎?如果之後metadata有更新(格式發生變化)的話?

Haser0305 commented 11 months ago

目前是跟 v0 一樣維持在檔案的開頭前2Bytes,但是變到了 V1,因為現在 importer 這邊還沒有應對 metadata 的部分做變更

chia7712 commented 11 months ago

目前是跟 v0 一樣維持在檔案的開頭前2Bytes,但是變到了 V1,因為現在 importer 這邊還沒有應對 metadata 的部分做變更

加上 metadata 後版號應該要提升一個,所以現在應該是要改成 v1 沒錯~