1. 數(shù)字3D藍(lán)腦計劃 我們的大腦由數(shù)十億個神經(jīng)元組成,而這些神經(jīng)元又通過數(shù)萬億個突觸連接起來。神經(jīng)元的排列方式?jīng)Q定著大腦的功能和一個人的個性。最近,瑞士的科學(xué)家首次發(fā)布了“藍(lán)腦計劃”繪制的數(shù)字3D腦細(xì)胞圖譜——他們詳盡構(gòu)建了一只老鼠大腦的完整細(xì)胞圖譜。 在慶賀這是一重大成就的同時,科學(xué)家也面臨著巨大的挑戰(zhàn):如何破譯這些圖譜。 ○ 首個老鼠大腦的數(shù)字3D細(xì)胞圖譜。 | 圖片來源:Blue Brain Project 2. 純理論,新技術(shù) 如何將大量的信息轉(zhuǎn)化為有用的見解?科學(xué)中充滿了這樣的問題。多年來,研究人員依靠數(shù)學(xué)和統(tǒng)計學(xué)對數(shù)據(jù)進(jìn)行深挖與探索。由數(shù)字存儲、互聯(lián)網(wǎng)和低廉的傳感器導(dǎo)致的大型數(shù)據(jù)集的爆炸式增長,催生了許多專門用于處理“大數(shù)據(jù)”的新技術(shù)。 如今,在一種已存在了百年之久的思想之上,建立起了一種新的方法。它的出現(xiàn)為理解一些特定類型的大數(shù)據(jù)提供了更好的工具。以老鼠的大腦為例,大腦的物理形狀決定了它的功能。然而,即使有了大腦形狀的精確描述(就像現(xiàn)在這樣),也并不能就自動揭示出大腦如何工作的全部奧秘。 除了大腦的物理形狀,大腦內(nèi)部的相互連結(jié)還形成了一種更為抽象的形狀。而新方法中所涉及到的拓?fù)浼夹g(shù)就可被用來捕捉這種抽象形狀的各各方各面,從而幫助我們更深刻地理解大腦的功能。不僅如此,拓?fù)浼夹g(shù)應(yīng)用于大數(shù)據(jù)的指導(dǎo)原則還適用于如藥物開發(fā)等許多其他的前沿領(lǐng)域。 3. 百年之后的意外驚喜 拓?fù)鋵W(xué)是現(xiàn)代幾何學(xué)的一個分支,它的起源可以追溯到瑞士數(shù)學(xué)家歐拉對多面體所做的基本觀察。多面體是由平面、直線的邊和尖銳的角(或者說頂點)組成的三維形狀。1750年,歐拉發(fā)現(xiàn),對于任意的凸多面體(所有的面都指向外部),頂點數(shù)減去邊數(shù)加上面的數(shù)量總為2。 ○ 歐拉公式。 | 圖片來源:Redlegagenda 同樣的公式也可以應(yīng)用于其他形狀,來得到它們的歐拉示性數(shù)。無論形狀如何彎曲或變形,歐拉示性數(shù)都保持不變。拓?fù)鋵W(xué)研究的正是形狀的不變特性。 作為一門重要的純數(shù)學(xué)學(xué)科,拓?fù)鋵W(xué)在20世紀(jì)經(jīng)歷了快速的發(fā)展。創(chuàng)建這門學(xué)科的研究者最初只是對特定條件下的幾何形狀的數(shù)學(xué)特性感興趣,并沒有想著要有什么現(xiàn)實應(yīng)用。 然而,存在了100多年的拓?fù)鋵W(xué)中的一些思想,卻在如今的數(shù)據(jù)科學(xué)領(lǐng)域找到了重要的應(yīng)用。因為拓?fù)潢P(guān)注的是恒定不變的屬性,因此與它相關(guān)的技術(shù)能對各種數(shù)據(jù)誤差或“噪聲”不敏感。這就讓拓?fù)鋵W(xué)成為破解收集到的數(shù)據(jù)背后的真正含義的理想工具。 有一個普遍的拓?fù)鋵W(xué)現(xiàn)象你或許會很熟悉。早晨把耳機(jī)整齊地放進(jìn)包里,到了中午卻會亂作一團(tuán)。耳機(jī)線是一種非常簡單的形狀,它是否會打結(jié)是一個拓?fù)鋯栴}。我們已經(jīng)對包里的耳機(jī)線是否會糾纏成一團(tuán)亂麻已經(jīng)有了很好的理解。 ○ 圖片來源:Penn State University 數(shù)百萬年前,生物演化也面臨過類似的問題。細(xì)胞中的DNA是由兩條螺旋狀的鏈組成的分子。每條鏈都是一根很長的線,由一系列叫做堿基的小分子組成。當(dāng)細(xì)胞分裂時,這些DNA鏈會經(jīng)歷解螺旋、復(fù)制等過程,然后重新卷成螺旋狀。就像包里的電線一樣,DNA鏈也會糾纏在一起,阻止細(xì)胞分裂,導(dǎo)致細(xì)胞死亡。 細(xì)胞中有一種特殊的酶能夠阻止這種災(zāi)難發(fā)生,那就是拓?fù)洚悩?gòu)酶。故意破壞細(xì)菌的拓?fù)洚悩?gòu)酶可以阻止細(xì)菌擴(kuò)散,從而防止感染。這意味著,如果能更好地理解拓?fù)洚悩?gòu)酶是如何阻止DNA纏繞的,就可以幫助我們設(shè)計新的抗生素。因為纏繞就是一個純粹的拓?fù)涮卣鳎酝負(fù)浼夹g(shù)可幫我們做到這一點。 4. 藥物開發(fā) 拓?fù)鋵W(xué)也可以用來改進(jìn)新藥物的開發(fā)。藥物是經(jīng)過設(shè)計的化學(xué)物質(zhì),它們以一種特殊的方式與體內(nèi)特定的細(xì)胞相互作用。具體說來就是細(xì)胞上有受體,可以讓特定形狀的分子鎖定它們,從而改變細(xì)胞的行為。所以,制造具有這些形狀的藥物就能使它們瞄準(zhǔn)和影響正確的細(xì)胞。 事實證明,制造出具有特定形狀的分子是一個相當(dāng)簡單的過程。但將藥物送到靶細(xì)胞的最簡單方法就是通過血液輸送,因此,藥物必須是水溶性的。當(dāng)一種形狀正確的藥物被生產(chǎn)出來后,最重要的問題是:它會溶解在水中嗎?然而,僅僅知道分子的化學(xué)結(jié)構(gòu)很難回答這個問題。許多藥物開發(fā)項目都因為溶解性問題而失敗。 這就是拓?fù)鋵W(xué)的用武之地。把整個分子集合看作一種可以用幾何方法研究的數(shù)學(xué)實體,這種方法被稱為“分子空間”。對于開發(fā)新藥物而言,一張分子空間的圖譜將是一個強(qiáng)大的工具,如果這張地圖上包含了指示溶解概率更高的地標(biāo),那就更是如此了。 在最近的工作中,研究人員使用拓?fù)鋽?shù)據(jù)分析工具作為第一步來生成這種圖譜。這種新方法通過分析聯(lián)系了分子性質(zhì)與水溶解度的大量數(shù)據(jù),發(fā)現(xiàn)了之前從未被懷疑過的新的溶解度指標(biāo)。水溶性藥物的生產(chǎn)能力的提高,或許能大大縮短開發(fā)新療法所需的時間,讓整個過程更便宜。 在越來越多的科學(xué)領(lǐng)域,研究人員發(fā)現(xiàn),他們掌握的數(shù)據(jù)多于他們能夠有效理解的數(shù)據(jù)。面對大數(shù)據(jù)帶來的數(shù)學(xué)挑戰(zhàn),現(xiàn)代數(shù)學(xué)家的應(yīng)對之策仍在展開,而拓?fù)渥鳛橐环N只受想象力束縛的理論,必將有助于塑造大數(shù)據(jù)的未來。 撰文:Ittay Weiss(樸茨茅斯大學(xué)數(shù)學(xué)講師) 原文標(biāo)題為“Big data is being reshaped thanks to 100-year-old ideas about geometry”,首發(fā)于2019年2月20日的theconversation。原文鏈接:https:///big-data-is-being-reshaped-thanks-to-100-year-old-ideas-about-geometry-111460. 中文內(nèi)容僅供參考,略有單增,一切內(nèi)容以英文原版為準(zhǔn) |
|