雲端可以幫我們解決哪些問題
套句我同學 Martin (他以前在 Novell 上班, Eric Smith 是他的前老闆) 說的話,從 1960 年代後,電腦就沒有新發明的科技了,在資訊的領域混的越久,越能體會這句話是真的。
我的老闆史丹,他剛畢業時在貝爾實驗室工作,負責開發醫院的訊系統,那時是大約 1970 年代,他在那個實驗室待了大約兩年的時間後,後來那個部門不賺錢,貝爾就把它收起來了(試想那時有幾家醫院有電腦,我們系上號稱是醫學資訊的始祖,在那時可能也剛創立而已),記得那時我問過我老闆一句話,從他在貝爾時期到現在,其中大約三十年的時間,在我們這個領域,有沒有什麼東西是比較新的發明,他的回答跟我同學說得一樣,一些重要的理論或概念那時其實都已經發展完成了。
那這樣說來這些年來科技界不就都是白發展的,但是又見到在資訊界的人有越來越多新的資訊要學習,可是不是又說沒有新的科技發明,這不是充滿了矛盾嗎。我也問過我老闆這個問題,他說:理論是都發明了沒錯,但是受限於科技的發展,很多理論在過去是無法被執行的,然而現在科技(尤其是硬體)越來越進步,很多以前無法實現的科技,現在都可以一一達成。
是的沒錯,目前電腦越來越快,儲存媒體越來越便宜,的確以前所有的限制都一一去除了,現在資訊界的人就是要把過去的理論,變成可以實際應用的科技。如果套用摩爾定律的算法,每十八個月,電晶體的數目會倍增,這也代表我們電腦的處理能力,也大約每十八個月會倍增,這理論其實用在儲存資料上也是適用,硬碟從 20MB 到現在的 2TB (20MB*100K) 約莫 20多年的時間,大概買硬碟的價錢已經越來越穩定,只不過可以買到的容量,越來越大而已。
說起雲端,我想許多人對它的印象,可能是跟我 2000年時,第一次開始接觸到 globus, mpi, 時的印象差不多,有許多基本的問題搞不清楚,比方說:
1. 是不是程式丟在很多台電腦上,執行的速度就會變快(不是,要看問題種類,大多數都是不行)
2. 程式須不須要修改(除了極少數解方程式的函示庫,天生適合平行運算,不須修改外)
3. 它到底是怎樣執行的(基本上你就想像你是老闆,你有十個員工為你工作,你需要如何指揮他們協同工作,基本上寫平行處理的程式也是差不多需要那麼多工夫。)
在花了段時間了解 globus , mpi 之後,這些答案對我來說都是再清楚不過了,但是當初霧裡看花的感覺,我想大多數人現在聽到雲端,就跟我當初第一次研究 globus 時的感覺一樣。
許多人都試著給雲端給些定義,但是因為探討的面向不同,所以講法也不太一樣,對雲端沒有概念的人聽了之後,會有了瞎子摸象的感覺。
基本上,如果回到之前開始的論調,就是雲端也不是新科技,它是因應現在硬體的新發展,所產生的新應用科技,它的目的是要運用我們在硬體上的發展,來解決我們目前科技所遇到的問題。比方說,更多的處理器,更快的網路,更多的記憶體與硬碟。如果從我們目前科技所遇到的問題來討論,雲端可以幫助我們解決哪些問題,在探討所運用到的相關技術,這樣我們可以更清楚的了解我們需要掌握哪些雲端的相關技術,才能真正的運用雲端來幫我們解決問題。
現在我們遇到的瓶頸,也給了目前的資訊業一個新的發展方向,底下列出了一些重要的困難與相關解的資訊技術服務:
1. 資料儲存擴充,備份,存取不易 (Amazon S3, Dropbox, HDFS of Hadoop)
2. 電腦更新硬體不易,硬體升級我想是每個資訊人員的惡夢 (Virtualbox, VMWare, Paralle, Xen framwork)
3. 電腦作業系統備份 被援 不易 (Timemachine of OSX, Timeslider of opensolaris, Replication of Hadoop)
4. 資料庫擴充 存取速度 備份 不易 (Big table of google, mysql cluster, Hive of Hadoop)
5. 撰寫平行處理的程式 不易 (MapReduce framework, Hadoop)
6. 可彈性調整運用的電腦資源,網站頻寬受限,要倍增網站處理能力,所付出的代價太高 (Google app engine, Amazon Cloud, Ubuntu Cloud, Hadoop)
待續
我的老闆史丹,他剛畢業時在貝爾實驗室工作,負責開發醫院的訊系統,那時是大約 1970 年代,他在那個實驗室待了大約兩年的時間後,後來那個部門不賺錢,貝爾就把它收起來了(試想那時有幾家醫院有電腦,我們系上號稱是醫學資訊的始祖,在那時可能也剛創立而已),記得那時我問過我老闆一句話,從他在貝爾時期到現在,其中大約三十年的時間,在我們這個領域,有沒有什麼東西是比較新的發明,他的回答跟我同學說得一樣,一些重要的理論或概念那時其實都已經發展完成了。
那這樣說來這些年來科技界不就都是白發展的,但是又見到在資訊界的人有越來越多新的資訊要學習,可是不是又說沒有新的科技發明,這不是充滿了矛盾嗎。我也問過我老闆這個問題,他說:理論是都發明了沒錯,但是受限於科技的發展,很多理論在過去是無法被執行的,然而現在科技(尤其是硬體)越來越進步,很多以前無法實現的科技,現在都可以一一達成。
是的沒錯,目前電腦越來越快,儲存媒體越來越便宜,的確以前所有的限制都一一去除了,現在資訊界的人就是要把過去的理論,變成可以實際應用的科技。如果套用摩爾定律的算法,每十八個月,電晶體的數目會倍增,這也代表我們電腦的處理能力,也大約每十八個月會倍增,這理論其實用在儲存資料上也是適用,硬碟從 20MB 到現在的 2TB (20MB*100K) 約莫 20多年的時間,大概買硬碟的價錢已經越來越穩定,只不過可以買到的容量,越來越大而已。
說起雲端,我想許多人對它的印象,可能是跟我 2000年時,第一次開始接觸到 globus, mpi, 時的印象差不多,有許多基本的問題搞不清楚,比方說:
1. 是不是程式丟在很多台電腦上,執行的速度就會變快(不是,要看問題種類,大多數都是不行)
2. 程式須不須要修改(除了極少數解方程式的函示庫,天生適合平行運算,不須修改外)
3. 它到底是怎樣執行的(基本上你就想像你是老闆,你有十個員工為你工作,你需要如何指揮他們協同工作,基本上寫平行處理的程式也是差不多需要那麼多工夫。)
在花了段時間了解 globus , mpi 之後,這些答案對我來說都是再清楚不過了,但是當初霧裡看花的感覺,我想大多數人現在聽到雲端,就跟我當初第一次研究 globus 時的感覺一樣。
許多人都試著給雲端給些定義,但是因為探討的面向不同,所以講法也不太一樣,對雲端沒有概念的人聽了之後,會有了瞎子摸象的感覺。
基本上,如果回到之前開始的論調,就是雲端也不是新科技,它是因應現在硬體的新發展,所產生的新應用科技,它的目的是要運用我們在硬體上的發展,來解決我們目前科技所遇到的問題。比方說,更多的處理器,更快的網路,更多的記憶體與硬碟。如果從我們目前科技所遇到的問題來討論,雲端可以幫助我們解決哪些問題,在探討所運用到的相關技術,這樣我們可以更清楚的了解我們需要掌握哪些雲端的相關技術,才能真正的運用雲端來幫我們解決問題。
現在我們遇到的瓶頸,也給了目前的資訊業一個新的發展方向,底下列出了一些重要的困難與相關解的資訊技術服務:
1. 資料儲存擴充,備份,存取不易 (Amazon S3, Dropbox, HDFS of Hadoop)
2. 電腦更新硬體不易,硬體升級我想是每個資訊人員的惡夢 (Virtualbox, VMWare, Paralle, Xen framwork)
3. 電腦作業系統備份 被援 不易 (Timemachine of OSX, Timeslider of opensolaris, Replication of Hadoop)
4. 資料庫擴充 存取速度 備份 不易 (Big table of google, mysql cluster, Hive of Hadoop)
5. 撰寫平行處理的程式 不易 (MapReduce framework, Hadoop)
6. 可彈性調整運用的電腦資源,網站頻寬受限,要倍增網站處理能力,所付出的代價太高 (Google app engine, Amazon Cloud, Ubuntu Cloud, Hadoop)
待續