挑戰海量數據：基于Apache DolphinScheduler對千億級數據應用實踐( 三 )

2026-05-09 生活百科

set spark.sql.adaptive.enabled=true;set spark.sql.adaptive.shuffle.targetPostShuffleInputSize=256000000;參數優化
CK的優化參數非常多，除了基礎的參數外，在二級索引調整為布隆過濾器后，寫入CK的parts就比原來多了，在這個時候調整CK的parts參數，使其可以正常運行，但是這個參數會稍微影響一下CK查詢的性能，對于我們來說，數據都放不進去，再查詢也就沒有用了。
parts_to_delay_insert：200000此外還可以添加background_pool_size參數（我們沒有用）。
Zookeeper優化
對于ClickHouse多分片多副本集群模式來說，Zookeeper是最大的性能瓶頸點。
在不改動源碼的情況下，我們做了如下的優化：

- 上一頁
- 1
- 2
- 3
- 下一頁
推薦閱讀

上一篇：簡析 Linux 的 CPU 時間

下一篇：會玩飛行棋怎么進房間（飛行棋的玩法和規則)