2013年4月28日 星期日

從高鐵延誤看被輕視的專業



今天看到蘋果日報以大篇幅報導《幾分鐘可解決的故障 高鐵竟停擺4小時》(註1)這則新聞,讓筆者深深感受到台灣人如何作賤專業。


撰寫過軟體或是維護過資訊系統的人應該很清楚,一個系統出了問題,第一件事情絕對不是,也不該是重開機。有問題出現,代表一定是有程式在特定的系統環境下出錯了。要找出問題,除了從程式碼來尋找以外,還要從系統環境來找。這兩個要素湊起來才能找到問題。但重開機就直接把系統環境還原,因此引發問題產生的原因消滅了,就很難再次找到原因了。重開機看起來是短時間解決了問題,但是問題並沒有真正被解決。一旦滿足了問題發生的條件,這個問題還是會再度出現。所以,通常面對這種狀況,通常會立刻停止運作,在系統中尋找問題。若一時三刻找不到問題,也會立刻傾印(dump)當前系統,確定所有除錯相關數據都有紀錄後,先重開機或重置讓系統恢復運作,減少對線上服務的衝擊,事後再從保存的資料中進行後續除錯。


這次高鐵花了4個小時維修,最後重開機,有可能是已經找到問題相關來源,若尚未找到問題,也有可能已經保存好相關數據,最後再以重開機的方式恢復運作,事後進行除錯。最糟糕的狀況是什麼都沒有解決,在高層的壓力下重開機恢復運行。我們不知道這4個小時究竟發生了什麼事情,但絕不能因為最後使用重開機的手段作為恢復運行的方式,就認定前面的步驟和過程都不重要,只要重開機就好。有許多人質疑處理問題還要花4個小時,高鐵專業度不足;那麼請問,面對一個這麼大的系統,又牽涉到許多硬體、軟體的整合,問題也是之前沒有發生過的,4個小時之內要技術人員處理好問題,這個要求是否太過苛責?


今天記者撰寫這篇報導,很明顯是認為高鐵號誌系統的故障只要立刻重開機就好,不用停駛,數分鐘內問題就可以解決。試問,如果不停駛就重開機,而此時剛好有列車正在行駛,是否可能因為重開機而導致高鐵出車禍?若出車禍,要怎麼辦?另外一名聯合報記者採訪不具名專家,寫出這篇報導《專家:可手動發車 不必全線停擺》(註2),筆者認為也有問題。筆者並非鐵道專家,不確定真正的專家對此事的看法。但根據維基百科的資料,中國溫州動車事故的事故原因,就正是跟這次高鐵一樣的號誌系統故障。系統故障後,列車採取手動發車,結果造成追撞事故。據官方數字,一共有40人死亡、172人受傷(註3)。同樣是號誌系統故障,到底是延誤4小時比較好,還是人命死傷比較好?如果是真的專家所言,筆者便不予置評。但這些評論來自於不具名專家,實在令人懷疑訊息來源是否真的為專家?


今天這些工程師花了4個小時維修系統、找出問題,是為了維持列車的安全,以及防止未來再度發生這樣的問題。如果長官下令運轉,這些原本被延誤的3.5萬人,將有部份可能因列車追撞而喪命。這些維修的工程師,才是真正拯救人命的英雄,但卻被這些不專業的記者罵成狗熊。難道一定要跟中國一樣,等到出事了,再來報導救難人員的英雄事蹟,讓長官「俯身獻菊花」嗎?


筆者在此並不是認為專家的話就不容質疑。首先,值得信任的專家應當俱備專業素養,以數據、理論及邏輯思考加以判斷事物,而非以意識型態凌駕一切。面對使用者的需求和想法,專家也應聆聽,並以簡單扼要的方式儘量讓使用者理解他們的專業處理方式,確保自己提供的建議、作法能符合需求。而使用者提供意見的範圍也並非無限上綱。許多專家亦是提供服務給需要的消費者,消費者可在需求這方面和專家進行溝通,確保專家的服務符合自己的期待(例如高鐵停駛後需提供怎樣的替代應急方案);但在專業的執行上,就需尊重專家的判斷(例如如何解決高鐵故障問題、需花多少時間等)如果真的要質疑專家的判斷,那麼也要做足事前準備,先閱讀相關資料,從專業的角度和專家討論。在一個良好的專業人士及客戶的互動上,互相尊重彼此各自的專業及經驗非常重要。

從這件事情可以看到什麼?我們可以看到整個台灣社會都彌漫著不尊重專業的態度。很多時候,台灣人面對自己不懂的專業,總是「不求甚解」,稍微用腦袋隨意想想,就以不知道哪裡來的自信衝上前去對著專業人士指點,或是強迫這些專業人士用自己的方式隨意處理。反過來說,也有許多專家或政客面對使用者的需求的時候自我中心,聽不到真正的需求,且以傲慢的態度回應使用者的質疑。在這件事情上,記者對著那些真正拯救了人命的高鐵工程師指指點點,要他們「只要重開機就可解決問題」、「故障依然可以手動發車」,之前就有法官以醫生誤診為由把醫生告上法院(註4),也有流氓因為不理解醫生的醫療行為而毆打醫生(註5)。在日前中時發的《被H7N9觸動的記憶》一文中,作者也提到當時SARS時曾與患者家屬有近距離接觸,只是因為「淹沒在人群,沒有出現在鏡頭裡,未接獲通知,也不好意思開口。繼續上班,追逐SARS。」(註6)。TVBS則是在報導新聞時訪問「專家」魚販李嘉亮,稱魩仔魚就是指特定不會長大的魚種,並非各種小魚苗的集合(註7)。

這些人是台灣冰山的一角嗎?其實不是,這些人是台灣大多數人們的寫照。大多數的台灣人面對不是很了解的專業的時候,往往很少自己動手先去尋找相關資料,加以了解學習。而往往卻以自己的想法隨意推斷,甚至輕視對方的領域,動輒說出「這不是很簡單?為什麼不這樣做?」的話。面對專家的說明,台灣人也很少嘗試理解,卻常常斷章取義,只取自己想聽的部份。以筆者所處的軟體業為例,許多台灣的老闆面對專業的軟體撰寫人才,居然認為這些人「不過是坐在那邊敲鍵盤打字,何必坐領高薪」(註8)?

一旦發生錯誤,台灣人會通盤檢討,找出問題嗎?不會。很多時候,台灣人會很簡單的只要求一個交代,然後用最簡單的方式(例如重開機)來解決問題就好。就跟台灣的教育一樣,只要可以找到「標準答案」填上去,就有分數了,就夠了。至於這個答案背後的原因是什麼?是不是最好的答案?後續是不是還有其他需要注意的?這些都被忽略了,因為「拿不到分數,不重要」。所以發生問題的時候,台灣的記者就成為台灣人的代表,到處去「要一個交代」。至於交代合不合理?給出交代的人身份是否合理?背後的原因是什麼?要如何防止這個問題再度發生?這些問題似乎就沒有人關心了。整個社會就像看好戲一樣叫囂著要別人下台、負責、給交代,接著呢?沒事了,被忘記了。同樣的問題,還是會再一次的發生(註9、10)。如果這次高鐵號誌故障就簡單的重開機解決,未來將可以預期同樣的問題還是會一再發生,直到發生了人命損失,再來「痛定思痛」。

如果我們的社會真的認為「只要重開機就好,因為是幾分鐘可解決的故障」,會發生什麼事情?以中國為例,每次地震,災區就是豆腐渣房屋倒一片,沒有人想著究責、防範,只有一片倒的報導解放軍的英勇、救災人員的英雄事蹟,卻沒有想過,或許應該像日本一樣,制定完整的法規、落實建築的工法,減少偷工減料,自然就可以減少受傷死亡的人數。日本面對和中國四川雅安相近的7級地震,僅有4人死亡、10人受傷(註11),而中國截至目前為止卻已經193死亡,12211人受傷(註12)。

每次的中國災難都會被中國媒體塑造出一堆英雄。對比台灣這次高鐵延誤,工程師卻被罵成狗熊,正應驗了一句話:「災難發生後才有英雄,防止災難的則是狗熊」。如果希望台灣跟中國一樣以人命為代價量產英雄,或是希望醫療繼續崩壞、專業人才離開台灣,那麼台灣人就繼續盲目的輕視專業吧!



35 意見:

張小明 提到...

請問一下,這篇文章方便轉載嗎?

BoHan Chen 提到...

沒錯大大所言即是。

媒體的素養真的越來越"低"!!

不過高鐵事件當下的緊急應變方法,與善後補償真的非常需要檢討。

但某新聞台(非蘋O)卻在報:大家都知道電腦當機,只要簡單的按下重新開機鍵,就可以回復原狀,高鐵的人居然那麼久才想到,那麼多領高薪的資深人員都沒想到,害的旅客延誤...BLABLA(以下略)~~~

幹!!! 光看這裡就我火大!!
畫面秀出家用PC????(此時畫面還拍記者按下重新開機鍵.....) *當下有點太認真,我差點沒砸電視!!

雖然我不知道這次當機的系統複雜程度,自己也不是高鐵的工程師。
但,新聞把高鐵系統和那種市面上可以簡單買到的家用的桌上型PC相比??

最無腦的是那句,大家都知道只要按下重新開機鍵!!

個人解讀:
1. 重新開機鍵,就算是家用PC,那也是不得已的最終手段,並不是第一個方法,記者請搞清楚!!

2.大型系統可以隨便按下重新開機???那根本不需要管理與維護人員啦,原來事情都這麼簡單唷!? (殊不知本來沒問題,搞不好因此衍伸出更多問題該怎麼辦?)

會按下重新開機,就代表著有最壞的打算,也代表著可能面臨更多問題。諸如:有另一系統沒被喚醒(正常運作)。

基本概念都沒有的人,卻對著專業人士鬼吼鬼叫的? 這是流行嗎?

許峰豪 提到...

雨蒼回來玩EREP阿

Javaer 提到...

撰寫過軟體或是維護過資訊系統的人應該很清楚, on production system 是應該盡快令系統重新工作的. 找bug是應該另setup 環境或在production系統中增加監察數據.而不應該在production系統中慢慢找bug!

邱紀維 提到...

hi~我是rommelTaiwan
為您致上來自於erep的問候!

Jack Chien 提到...

如果只是維修人員操作程序錯誤,而根本不是系統有問題?===像這類系統,安全係數都設很高,很多時候你只要一操作錯誤,系統就會要求重開機,一步一步重新正常啟動,系統(一零件)兩天前就故障,自動切換成備援系統(零件),高鐵還是維持正常營運。直到維修人員更換故障零件,無法順利切換回主系統,才導致高鐵停駛 -> 很可能是更換零件時,程序錯誤。(而且如果是大故障,維修人員敢在早上五點,開車一小時前才維修,我很懷疑)

高真 提到...

專業不是談要如維修!而是如何班排乘客的轉乘,這一點都做不好不要說有多專業!
專業是在工程前用專業完成工程,完成後叫工程師









.

left270 提到...

社會沒有真的認為只要重開機就好,是媒體想要引導這樣的結論,我看他們新聞頁面下面臉書回應欄位都一堆吐槽的,幸好清醒的人還不少,看來台灣民眾的媒亂抗體都被訓練得蠻強的。

咪咪咪 提到...

我不懂高鐵那塊的專業


不過用部分(大多)(版面大)的記者來評斷大部分甚至整個台灣社會就太嚴重了


一點讀書心得

咪咪咪 提到...
作者已經移除這則留言。
改變世界從改變觀念做起!! 提到...

大大寫的好! 借轉貼(著名出處) 感恩!!

Nell Hung 提到...

您好

我是商周網站的編輯Nell,
我們覺得這篇文章很有意思,希望能讓更多人看到,
不知能否轉載到商周討論區,當然一定會註明來源並連回您的部落格,
若您覺得還有其他需要需要注意的事項,我們也會盡力配合。
若有打擾請見諒,期待您的回覆。

商周討論區:http://forum.businessweekly.com.tw/

Nell

言文 提到...

很同意您絕大部份的看法,但是拿这次的川震和日本的比会不会又显出了您的一些些不专业呢?日本这次千岛群岛地震发生在哪儿?主要人口居住地震级多少?人口密度多少?是不是都需要和四川进行对比?(震央在俄羅斯薩哈林州千島群島(北緯46.2度、東經150.9度))。。。。只是个人建议

asdasdf 提到...

台灣大學電機工程學系特聘教授郭斯彥說,電子系統雖存有許多無法意料狀況,但搞到全台停駛,「很令人訝異」,其實重開機對系統安全影響不大,只需幾分鐘,高鐵太沒經驗了。


郭斯彥教授不算是專家嗎?

作者斷章取義很不誠實。

asdasdf 提到...

台灣大學電機工程學系特聘教授郭斯彥說,電子系統雖存有許多無法意料狀況,但搞到全台停駛,「很令人訝異」,其實重開機對系統安全影響不大,只需幾分鐘,高鐵太沒經驗了。


郭斯彥教授不算是專家嗎?

作者斷章取義很不誠實。

林雨蒼 提到...

@Nell:
我的文章授權是創用cc-by-nc,歡迎轉貼。另外我的文章晚點會有修正,請留下您的mail或聯絡方式,我將親自寄上文章,方便使用。

@言文:
是的,在舉證方面我的例子太沒有說服力了。我正在思考如何修正,還請見諒。

@asdasdf:
教授就一定是可信的專家嗎?

ARVIN 提到...

雖然我滿認同這篇所講的「尊重專業」的觀念,但台灣核四的例子也讓我覺得,有時專業也是為財團跟政府服務的,一些核工專業的人也一直說「不要用民粹凌駕專業」,政府也塑造一種一定要通過的決心,但是難道不懂專業的老百姓,就沒有資格替自己的生命安全表達意見嗎?所以,這是我想請教原PO的地方:如何區分"專業"跟"御用學者"? 如何區分"老百姓心老聲"跟"民粹"?

ARVIN 提到...
網誌管理員已經移除這則留言。
Ferry 提到...

對於您點出媒體的不專業本人深感認同,但您文中假定重開機導致車禍和全手動駕駛會發生追撞的論點本人以相關行業來做澄清以正視聽。

以現代的列車要能達成自動駕駛要三要件,一是軌道電路,二是號誌系統,三是列車車載電腦接收前面兩個要件發送的信號運算後決定是否繼續前進。三要件假如缺少一項(無預警當機或運行中人為”強制”重啟),都會導致運行中的列車緊急刹車且己進站停好的列車無法前進,所以您說的重啟導致車禍是不可能的。

再來有關手動駕駛分為全手動和半自動。半
自動是在前述的三要件運行正常的規範速限内來手動操作,電腦限制這路段最高100你硬
要推超過就是緊急刹車。而全手動就是故障發生無法自動駕駛時就需要控制室”授權”駕駛員切換全手動駕駛來達到移動列車的目
的。通常在全手動模式下考量到人的反應速
度安全考量下都會設定一個很低的速限為列車的最高速,再怎麼推操縱桿就是不會超
過。全手動危險在於如果駕駛員不想停車的話,除非斷電要不然列車是全權掌握在駕駛員手上。因此在控制室”授權”某一列車以全手動駕駛前都要確認此列車手動駕駛要停車的目的地中途軌道方位是否正確,有没有和前車保持安全距離,確認後才會下達手動駕駛至給定的目的地指令給該列車並要求有異狀立即停車回報。由此可知,要發生陸動車
事件要有多少人沒帶腦子上班,或是行車運轉規章致命的錯誤或遺漏導致根本不知道要
注意的地方而造成災難

Ferry 提到...

而且以軌道業的想法,車子動不了要旅客下車走軌道是最大條的事情,所以在確認安全無慮的前提下,重啟系統恢復自動駕駛絕對是最安全的優先選擇,而手動駕駛是倒數第二的選項,反正就是一定要把人送到最近的車站再說

林雨蒼 提到...

@Ferry:

感謝你的意見。可以的話,是否請您撰寫出一篇較為專業的文章,描述這些技術名詞,並且告訴大家這個系統一般如何除錯,並稍加推測高鐵的處理方式?

若您願意,我這篇文章也不枉為拋磚引玉了。

孫銘楷 提到...

作者您好:
不知您究竟是認為媒體記者作賤專業還是台灣人作賤專業?我個人推測是前者。但您用"讓筆者深深感受到台灣人如何作賤專業。"這樣是有欠公允的。會向您這樣提問,起因過去我看到一篇報導的標題寫「訴願成功,法院判勝訴」這是關於一位考教師資格僅因一題之差導致落榜的事件,但考生認為自已答案且有根據故才在訴願"不成功"後提訴訟,我馬上寫信給媒體,告知訴願要是成功,還需要上法院請求判決嗎?媒體有教育大眾功能,請勿亂報。不知您是否有投書蘋果?(若沒建議補投),其次相信您出發點有公益目的,建議您為文著述,用詞指涉下筆前再三思考,我是台灣人,我不輕視專業(沒有立場也不好意思向您說抗議),不過看到的一些人要求轉載,及分享就認不住想提些意見。謝謝

Alex Chang 提到...

作者你好
對於鐵道號誌系統的運作方式,我想你的專業水平跟記者差不多。
真的不要拿可能,也許,或許等言詞來說可以嗎?

陳昱光 提到...

如果要尊重專業,把事情做對,應該要堅持不重開機,為何只堅持4小時?

如果像你所說,已經保存好相關數據,最後再以重開機的方式恢復運作,事後進行除錯。根本與專業無關,只要有異常處置原則的SOP,一步步照辦就好了,為何需要4小時?

可見,尊重專業也有個極限,效率通常是優先於專業,尤其在講究時間的高鐵。

我不認為以時間來評斷並沒有太過分。當然這次沒有造成任何意外,這點做的很好。

黑哥 提到...

學者~教授.....他們只會~~火車過了才吹哨子(台灣諺語)啦.......每每出事後才見一堆學者教授出來屁......說錯了有誰會出來道歉呢.???唉...

林雨蒼 提到...

@張小明、@改變世界從改變觀念做起!!:
文章授權為cc-by-nc,歡迎轉載。

@Javaer:
你確定on production system如果出現會危害人身安全的問題的時候,也是儘快令系統重新工作嗎?

@咪咪咪:
媒體是台灣人的照妖鏡。媒體的問題,其實就是我們自己的問題。怪東怪西,不如多檢討自己,您說是吧。

@ARVIN
針對您的問題,我的文章內已經有更新了。其實要確定專家是否可信,最簡單的方式就是自己多去學習和了解專業知識。

@孫銘楷
其實你看我文章內就知道了。作賤專業的當然是台灣人。記者只是台灣社會的照妖鏡,事實上還有很多老闆、客戶也在作賤工程師啊。連我自己不小心也會有作賤別人專業的時候。當然用台灣人這個名詞有點太廣,但我還是希望大家多去思考:我是否在其他非自己專業的方面,有時候把那些事情想的太簡單了呢?

@Alex Chang
是的。我只是覺得身為跟那些維修的工程師一樣的身份,有必要出來為專業人士說點話罷了。

@陳昱光
要除錯,針對正在出錯的系統來除錯是最好的。效率的確優先於專業,那麼安全呢?

林雨蒼 提到...

@張小明、@改變世界從改變觀念做起!!:
文章授權為cc-by-nc,歡迎轉載。

@Javaer:
你確定on production system如果出現會危害人身安全的問題的時候,也是儘快令系統重新工作嗎?

@咪咪咪:
媒體是台灣人的照妖鏡。媒體的問題,其實就是我們自己的問題。怪東怪西,不如多檢討自己,您說是吧。

@ARVIN
針對您的問題,我的文章內已經有更新了。其實要確定專家是否可信,最簡單的方式就是自己多去學習和了解專業知識。

@孫銘楷
其實你看我文章內就知道了。作賤專業的當然是台灣人。記者只是台灣社會的照妖鏡,事實上還有很多老闆、客戶也在作賤工程師啊。連我自己不小心也會有作賤別人專業的時候。當然用台灣人這個名詞有點太廣,但我還是希望大家多去思考:我是否在其他非自己專業的方面,有時候把那些事情想的太簡單了呢?

@Alex Chang
是的。我只是覺得身為跟那些維修的工程師一樣的身份,有必要出來為專業人士說點話罷了。

@陳昱光
要除錯,針對正在出錯的系統來除錯是最好的。效率的確優先於專業,那麼安全呢?

@HAO 提到...

完全同意您的見解!!原報導記者大概是希望有更大條的新聞吧!(誤)
另外,您的註7也不是正解哦!魩仔魚其實是各種魚苗也是小魚,視捕撈的季節、時機而定。

花名 提到...

如果連高鐵自己人都不願意向客戶解釋,您的假設又是作賤了誰的專業呢?異常處理當然不該是重開機這麼簡單,但拿高鐵來作文章還真是非常有人情味~

我認同@javaer的看法,既然您拿了高鐵來做例子,以結果論來說,他們的確在無技可施之下,只好重開機了…過了四小時,安全就不重要了嗎?我想不是吧…換我來假設一下吧~是"不敢"重開,您也是工程人員,想必明白那是個賭注~^^~

花名 提到...

如果連高鐵自己人都不願意向客戶解釋,您的假設又是作賤了誰的專業呢?異常處理當然不該是重開機這麼簡單,但拿高鐵來作文章還真是非常有人情味~

我認同@javaer的看法,既然您拿了高鐵來做例子,以結果論來說,他們的確在無技可施之下,只好重開機了…過了四小時,安全就不重要了嗎?我想不是吧…換我來假設一下吧~可能是"不敢"重開,您也是工程人員,想必明白那是個賭注~^^~

http://m.nownews.com/n/2013/04/28/2928413/

Javaer 提到...

若果on production system確定出現會危害人身安全的問題的時候是應該停止系統繼續運作!!!

on production system從來不應該是用來找bug的地方,若判斷系統繼續運作是不安全則應該停止運作. 若是判斷沒安全問題的則應盡快令系統重新運作,包括重開機!

找bug是應該另setup環境,或以後在 on production system中增加監測數據,並在非production系統中模擬問題,debug及測試!

林雨蒼 提到...

@花名、@Javaer:

這是一個來自PCDVD的高手留言,我相信應該比較好解答你們兩位的問題。
http://www.pcdvd.com.tw/showpost.php?p=1084090805&postcount=35

Javaer 提到...

Testing 環境不能重現production的問題,那應該去重建Testing環境,否則Testing環境是用來test什麼的? 那經過Testing環境的測試到底有什麼意義,不如develope後就直接拿到production用!
重要的系統(如此生命尢關的)testing環境必需可重現production的問題.試想到火星的太空船難道要到火星去debug? 看看電影太陽神十三號,地球的testing環境就挽救了三名太空人的生命及其家庭!

Tiger Chao 提到...

大大的評論太有正義了,雖然偶也是當時受害者之一,但仍強烈推薦本文。(偶搭10:30停駛後第一班車,一路從台北站到左營,每站都停)

ryan liu 提到...

孫銘楷先生您好:
您說道:「媒體記者作賤專業還是台灣人作賤專業?…」,有些雞蛋裡挑骨頭了。作者只是指部份人(換個場合,說不定大多數人(含我)都無意間犯了輕視專業的毛病)。依您推測作者是指媒體記者?媒體記者就不是台灣人嗎?相同的,若文章直指媒體記者,其他不同媒體的記者也要說:我是記者,我不輕視專業;若文章直指水果日報,那又有水果日報娛樂記者跳出,請指出是誰?我是娛樂版記者,我不輕視專業.........。