三秒架好 Hadoop service -Azure HDInsight
稍微玩了一下HDInsight
透過HDInsight 我們可以快速建立HADOOP 服務
在建立時 便可以決定節點數量跟性能
透過已經建立好的HADOOP SERVICE
我們可以快速的開始部屬服務或是進行練習
在HDinsight的組態裡面 我們可以建立一組遠端連線帳號
建立好我們便可以透過RDP連入主機
連進來便可以看到 這台Windows Server已經裝好Hadoop服務了
桌面上已經建好一些連結
我們可以看到機器工作的狀況
由於機群裡面只有一台機器
所以包辦所有的角色
我們用命令提示字元來用看看HADOOP
我們可以看一下Hadoop 檔案系統裡面的東西
可以看到 一些預設的資料夾
嘗試放個檔案進Hadoop File System
可以看到HADOOP服務 放入一個檔案在example目錄下
個人用戶使用HDinsight 要注意一件事
因為HDInsight的機器需要很好的效能(16 core)
所以他很貴
其實所謂的HDInsight
就是安裝好了Hadoop跟HIVE的Windows server
比較特別的地方是在於
一旦你建立機器在HDinsight群組裡面
你可以很容易的建立Hadoop cluster
他的價值在哪裡
如果你有玩過BigData的東西 就會知道
架設Hadoop跟Performance Turning是十分消耗開發人員精力的事情
因此才會有Etu、CloudEra這些廠商
協助客戶導入hadoop應用
而巨量資料須要配合彈性的機房建設
架構必須要隨著資料的成長而增減
這些都是一般用戶使用Hadoop的痛
我覺得
Azure HDinsight可以降低這些過程浪費的時間
至少我們可以利用它來進行初期驗證
驗證您的Hadoop服務架構是否正確
至於要不要在Azure上面跑 那就要看貴公司的荷包深不深摟~
留言