三秒架好 Hadoop service -Azure HDInsight

稍微玩了一下HDInsight

透過HDInsight 我們可以快速建立HADOOP 服務

在建立時 便可以決定節點數量跟性能

image

透過已經建立好的HADOOP SERVICE

我們可以快速的開始部屬服務或是進行練習

image

 

在HDinsight的組態裡面 我們可以建立一組遠端連線帳號

image

建立好我們便可以透過RDP連入主機

連進來便可以看到 這台Windows Server已經裝好Hadoop服務了

 

桌面上已經建好一些連結

我們可以看到機器工作的狀況

image

由於機群裡面只有一台機器

所以包辦所有的角色

image

我們用命令提示字元來用看看HADOOP

image

 

我們可以看一下Hadoop 檔案系統裡面的東西

image

可以看到 一些預設的資料夾

 

嘗試放個檔案進Hadoop File System

image

可以看到HADOOP服務 放入一個檔案在example目錄下

 

個人用戶使用HDinsight 要注意一件事

因為HDInsight的機器需要很好的效能(16 core)

所以他很貴

image

 

其實所謂的HDInsight

就是安裝好了Hadoop跟HIVE的Windows server

比較特別的地方是在於

一旦你建立機器在HDinsight群組裡面

你可以很容易的建立Hadoop cluster

他的價值在哪裡

如果你有玩過BigData的東西 就會知道

架設Hadoop跟Performance Turning是十分消耗開發人員精力的事情

因此才會有Etu、CloudEra這些廠商

協助客戶導入hadoop應用

 

而巨量資料須要配合彈性的機房建設

架構必須要隨著資料的成長而增減

這些都是一般用戶使用Hadoop的痛

 

我覺得

Azure HDinsight可以降低這些過程浪費的時間

至少我們可以利用它來進行初期驗證

驗證您的Hadoop服務架構是否正確

至於要不要在Azure上面跑 那就要看貴公司的荷包深不深摟~

留言

這個網誌中的熱門文章

Office 2021 離線安裝封裝與KMS啟動步驟

Ollama使用心得與模型導入教學

ARC下NSMutableDictionary 無法使用retainCount