通過Cloudera公司提供的ApacheHadoop培訓和認證將您的知識提升到一個新的水平。
Cloudera大學提供的針對ApacheHBase為期3天的培訓課程可以讓培訓學員存儲和訪問海量的多結構化數據,并且每秒的查詢速度提升至數十萬次。 提升你的生態(tài)系統專業(yè)知識 ApacheHBase是一款建立在ApacheHadoop基礎之上的分布式、可擴展NoSQL數據庫。HBase可以將數據存儲在由數十億行和數百萬列組成的海量表中,實時地向眾多用戶和應用程序提供數據服務,并且向用戶和應用程序提供快速、隨機的讀/寫存取功能。 一.培訓內容 ● 通過講師在課堂上的講解,以及實操練習,學員將熟悉Hadoop生態(tài)系統,學習主題包括: ● HBase、Hadoop和RDBMS的使用案例和使用場合。 ● 使用HBaseShell直接操作HBase表。 ● 設計HBase架構以實現高效的數據存儲和恢復功能。 ● 如何實時地使用JavaAPI插入和檢索數據而實現與HBase的連接。 ● 適用于識別和解決性能瓶頸的實踐。 二.培訓對象及學員基礎 本課程適合打算使用HBase的開發(fā)員和管理員。擁有數據庫和數據建模的先前經驗對于學習本課程是有幫助的,但不是必需的。本課程要求培訓學員具備Java知識。對于參加本培訓課程而言,Hadoop先驗知識不是必需的,但是Cloudera公司開發(fā)類的培訓可以作為本課程的前序課程。 三.課程大綱 1. Hadoop和HBase介紹 ● 什么是大數據 ● Hadoop介紹 ● Hadoop組件 ● 什么是HBase ● 為什么使用HBase ● HBase的優(yōu)勢 ● 生產中的HBase ● HBase的弱點 2. HBaseTables ● HBase概念 ● HBaseTable基礎知識 ● 表設計思考 3. HBaseShell ● 通過HBaseShell創(chuàng)建表 ● 表的使用 ● 表數據的使用 4. HBase架構基礎知識 ● HBase區(qū)域 ● HBase集群架構 ● HBase和HDFS數據本地性 5. HBase模式設計 ● 一般設計考慮 ● 以應用程序為中心的設計 ● 設計HBase行鍵 ● 其它HBas表功能 6. 基于HBaseAPI的基本數據訪問 ● 訪問HBase數據的選項 ● 創(chuàng)建和刪除HBase表 ● 使用Get檢索數據 ● 使用Scan檢索數據 ● 插入和更新數據 ● 刪除數據 7. 更多高級HBaseAPI功能 ● 篩選掃描 ● 實踐 ● HBase協同處理器 8. 集群上的HBase ● HBase如何使用HDFS ● 壓縮和分割 9. HBase的讀取和寫入 ● HBase如何寫入數據 ● HBase如何讀取數據 ● 讀取數據的塊緩存 10. HBase性能優(yōu)化 ● 列族注意事項 ● 模式設計注意事項 ● 高速緩存的配置 ● 時間序列和順序數據的處理 ● 預分割 11. HBase系統管理與集群管理 ● HBase守護進程 ● ZooKeeper注意事項 ● HBase的高可用性 ● HBaseBalancer的使用 ● 使用hbck修復表 ● HBase的安全性 12. HBase的復制和備份 ● HBase的復制 ● HBase的備份 ● MapReduce和HBase集群 13. Hive、Impala與HBase的協同使用 ● Hive、Impala與HBase的協同使用 14. 總結
Cloudera大數據課程體系
