利用人工智能來提高化學研究人員的生產(chǎn)力
作者: 來源: 時間:2023-05-12 訪問量: 765 |
世界各地的化學研究人員正在使用愛思唯爾(Elsevier)的專家策劃的化學信息平臺Reaxys來尋找他們在廣泛領域所需的信息和化合物,從制藥藥物發(fā)現(xiàn)和化學研發(fā)到學術(shù)研究和教育。最近,Reaxys Content Catalyst背后的團隊因其在分析、數(shù)據(jù)科學和人工智能方面的創(chuàng)新而被授予卓越數(shù)據(jù)科學獎(Excellence in Data Science Award)。 本文作者與愛思唯爾的高級數(shù)據(jù)管理專家Anitha Golla博士詳細談了談其團隊的工作,以及他們?yōu)椴粩鄶U大和更新Reaxys中的內(nèi)容所做的努力。
1億份文件和數(shù)據(jù) 該獎項為印度最大的人工智能會議Cypher22畫上了句號,當時Analytics India Magazine雜志于9月舉辦了第四屆獎項。該獎項認可了該團隊在人工智能驅(qū)動的內(nèi)容生產(chǎn)平臺Reaxys Content Catalyst(RCC)方面的努力,該平臺致力于從根本上提高Reaxys中可用的內(nèi)容,這反過來又有助于提高化學研究人員的研發(fā)效率。 獲獎的同時,該平臺還通過了一個驚人的分水嶺:處理超過1億份文件。 Anitha表示:“這兩項成就實際上只是證明了跨職能團隊的力量?!? 思想的多樣性:跨職能的合作 Anitha在德國Karlsruhe Institute of Technology(KIT)攻讀生物有機化學博士學位時,培養(yǎng)了在多學科團隊中工作的興趣。 “我的導師有一家小型創(chuàng)業(yè)公司,他的目標是為生物學家的研究提供盡可能多的多肽,這些多肽需要既便宜又高質(zhì)量。為了幫助實現(xiàn)這一目標,我必須與所有這些了不起的人一起工作:物理學家、生物學家、工程師等。” “從前,我基本上是一個孤獨的研究者。但這一經(jīng)歷幫助我了解到,如果你與所有這些不同的人合作,意想不到的事情就會發(fā)生。而且可以比你一個人做得更好、更快?!? 一個高影響力的團隊 Anitha目前工作的復雜性意味著她需要一個跨職能的團隊。 她說:“科學界發(fā)表了數(shù)百萬份文件,它們有能力在各個層面改變世界?!彼赡苁顷P(guān)于一種拯救生命的藥物,或者是關(guān)于改變我們的決策方式或處理某種挑戰(zhàn)。我們的工作是確保這些內(nèi)容是最新的,以便人們能夠以最便捷的方式獲取這些信息。" "我們的客戶能告訴我們他們想要什么" “我們的項目還因完全出于客戶需求而脫穎而出,”Anitha補充說?!拔覀兊目蛻魧崒嵲谠诘馗嬖V我們他們想要什么:能夠在過去20多年里發(fā)表的專利中迅速找到某些東西:物質(zhì)、生物目標等。他們希望了解競爭格局,以便能夠在這個格局中工作,而不是與之對抗。 “傳統(tǒng)意義上,只有一種方法可以獲得這種信息:雇用一支化學家大軍,逐行閱讀這些數(shù)百萬份文件。但當然,這效率太低了,而且成本很高。因此,我們力圖將這一過程自動化。畢竟,愛思唯爾已經(jīng)將數(shù)據(jù)科學應用于幾乎所有其他方面?!? 沒有一天是平凡的 該項目涉及一個40多人的團隊,取決于需要完成的工作。 “在任何一天,我與來自三或四個不同領域的人一起工作—核心化學家、數(shù)據(jù)科學家、數(shù)據(jù)工程師、數(shù)據(jù)架構(gòu)師、軟件人員,等等,”Anitha解釋說:“我必須從像化學家那樣思考,檢查一個結(jié)構(gòu)是否正確,或者像統(tǒng)計學家那樣看待它的精確性。因此,這讓我感到很興奮?!? 同時,這也能讓工作保持挑戰(zhàn)性?!澳阋苍S能想出一些對化學家來說有意義的東西。但是當軟件領域的人看到它時,他們會說它在計算能力或時間方面太昂貴了。后來,雖然一些東西可能在小范圍內(nèi)有效,但當它被生產(chǎn)化并應用于數(shù)百萬份文件時,情況就完全不同了。但奇妙的是,每個人都想找到一個恰當?shù)钠胶恻c,讓大家都滿意?!? 向前走,向上走 該項目從一開始就很有雄心。 Anitha解釋說:“它不僅僅是一個能夠快速、準確地處理專利的平臺,它還需要在每次有新事物到來時進行更新和升級——無論是更多的文件還是新技術(shù)、方法或產(chǎn)品。它需要成為一個完全模塊化的平臺,可以很容易地被采用并持續(xù)運行。因此,這涉及到大量的規(guī)劃?!? 現(xiàn)在,隨著平臺被擴展到來自期刊的數(shù)據(jù),所有這些規(guī)劃正在得到回報。計劃在2023年進一步迭代發(fā)展該基礎設施,包括擴展到愛思唯爾的生物醫(yī)學文獻數(shù)據(jù)庫Embase。 Anitha說:在未來的某一天,我看到一個可以讓任何內(nèi)容都通過的平臺,且能分支到不同的產(chǎn)品。由于愛思唯爾的大規(guī)模分類法,它將能夠自行對所有內(nèi)容進行分類。 “一旦你意識到你可以從數(shù)據(jù)的角度做這么多事情,天空就成了新的極限——不僅是對化學家和其他生命科學的研究人員,而是針對更廣泛的研究界?!? |