這不是一件可被嗤之以鼻的事情。計(jì)算機(jī)破解了一道困擾化學(xué)家?guī)讉€(gè)世紀(jì)的難題:從分子的結(jié)構(gòu)預(yù)測(cè)它的味道。這一壯舉或許使香水制造商和味道專(zhuān)家得以在試驗(yàn)和錯(cuò)誤大大減少的情況下創(chuàng)造新產(chǎn)品。相關(guān)成果日前發(fā)表于生命科學(xué)預(yù)印本網(wǎng)站bioRxiv。
和通過(guò)分析光波長(zhǎng)或聲音預(yù)測(cè)視覺(jué)和聽(tīng)覺(jué)結(jié)果不同,人類(lèi)的嗅覺(jué)一直很神秘。研究嗅覺(jué)的化學(xué)家從來(lái)沒(méi)能預(yù)測(cè)出某個(gè)特定的分子聞上去是何種氣味,除了在一些特殊情況下,由于一個(gè)分子結(jié)構(gòu)的很多方面可能在決定其氣味上發(fā)揮著重要作用。
來(lái)自美國(guó)紐約洛克菲勒大學(xué)的Andreas Keller和Leslie Vosshall決定利用機(jī)器學(xué)習(xí)的力量解決這一問(wèn)題。首先,他們讓49名志愿者依據(jù)氣味的濃度和愉悅程度及其同大蒜、香料或水果等19個(gè)其他描述語(yǔ)的匹配度,對(duì)476種化學(xué)物質(zhì)的氣味進(jìn)行評(píng)分。
隨后,研究人員公布了407種化學(xué)物質(zhì)的數(shù)據(jù)以及測(cè)定化學(xué)結(jié)構(gòu)的4884個(gè)不同變量,并且邀請(qǐng)所有人開(kāi)發(fā)能搞清楚這些模式的機(jī)器學(xué)習(xí)算法。他們利用剩下的69種化學(xué)物質(zhì)評(píng)估了各種算法的準(zhǔn)確性,其中有22個(gè)團(tuán)隊(duì)接受了這一挑戰(zhàn)。
事實(shí)證明,最好的算法比此前預(yù)測(cè)志愿者對(duì)接受測(cè)試的化學(xué)物質(zhì)所作描述的任何努力要準(zhǔn)確很多。這些努力不太理想,部分原因在于人們?cè)诘诙谓邮軠y(cè)試時(shí)極少能對(duì)相同的氣味給出一樣的評(píng)分。
下一個(gè)挑戰(zhàn)則是弄清楚化學(xué)物質(zhì)的混合物將產(chǎn)生何種味道。“現(xiàn)在做的是對(duì)單個(gè)分子進(jìn)行評(píng)定。”來(lái)自科羅拉多州柯林斯堡一家感官咨詢(xún)公司的Avery Gilbert表示,“更有用的是知道哪些成分能被很好地集成在一起。”