找回密码
 新注册用户
搜索
查看: 3826|回复: 4

[转帖] 【36Kr】大数据助力材料科学(WCG的CEP2相关)

[复制链接]
发表于 2013-9-29 15:11:50 | 显示全部楼层 |阅读模式
大数据助力材料科学
译者:Xingyu Chen
译文:http://www.36kr.com/p/206581.html
原文:Math matters: how big data is building the future of everything

新材料哺育新发明。Gorilla Glass 已经大量被应用于智能手机;凯夫拉在拯救生命之余开始进入消费级产品;锂离子电池技术为高能耗设施提供了动力来源。但是,研发新材料却是一项极其费时费力的任务。

创造一种全新的突破性材料是极其费时的过程 – 尤其是和那些依赖这些材料的产品的研发周期相比。波音 787 梦幻客机从概念到商业航行只花了 9 年不到;苹果从 2005 年开始设计 iPhone,2007 年就可以正式上市。作为对比,新型材料的诞生可能要花上长达 20 年的研究和实验。

两年前,美国政府以突破这个科技瓶颈为目标,成立了Materials Genome Initiative(MGI)项目。MGI 的目标是大幅减少新材料研发所需的时间和财力投入。和人类基因组计划为我们的基因绘制地图的任务类似,科学家想要通过 MGI 找出元素间的互相作用对材料的种类和性质带来的广泛影响。以这些知识作为基础,科学家和工程师们将有希望以更短的周期为不同应用“定制”相应的材料。

元素间排列组合的数目多如牛毛,其中大多数对我们来说没有意义。而试图在实验室里穷尽这些排列组合是完全不合实际的。所以,MGI 的一些项目组已经开始借助大数据的力量来模拟所有的可能性,然后通过分析数据向有潜力的方向进行深入研究。

成立多年以来,MGI 促成了一些第三方项目的合作。其中就有来自麻省理工学院的Materials Project和哈佛的Clean Energy Project。这两个计划以相似的理论基础寻求不同的答案。前者的研究集中在无机固体上,尤其以电池材料为主,而后者的清洁能源计划以可用于太阳能电池的分子材料为中心。两者均利用密度泛函理论(Density Functional Theory)收集的巨型数据库来预测模拟物质模型的实际属性。

MIT 的 Material Project 大约在 8 年前在 Gerbrand Ceder 教授的帮助下成立。作为多家公司的顾问,Ceder 积累了大量成果。但是和少数公司的合作使得这些宝贵数据被封闭起来。“如果我们向所有人提供这些数据,人们会创造出很多惊人的成果,这就是 Materials Project,”他说。目前, MIT 的数据库里保存了大约 10 万种已知或理论上的材料信息。为了充分发挥这些数据在新材料研发中的作用,MIT 学者用人工筛选加机器学习的方式来探索各种化学定律。

类似的,哈佛清洁能源计划也用人工加机器组合来探索其数据库。该计划始于一次对有机太阳能电池材料概念的验证实验。学者们完全虚拟的情况下计算了大约 15 种新型混合物在现实世界里的表现。模拟运算的最终结果是一种有超强电气性质的新物质。这还只是一名研究生通过几次实验得出的结果,想象如果从一支志愿者大军那儿借来他们的运算能力,结果会放大多少?

这正是清洁能源计划如今采用的策略:任何人都可以通过在电脑上下载一个程度来进行运算并把返还结果。有了这个可任意支配的巨大资源,学者们已经计算了几百万种潜在组合 – 这仅仅是个开端。“项目进入了一个十分有趣的阶段”Hachmann 博士说,“对我们来说差不多是从辛勤劳动中采集硕果的时候了。”目前,哈佛在网上发布了230万种混合物组合供所有人研究使用。虽然这些数据的初衷是助力太阳能电池的研发,科学家也可用任何有价值的信息来帮助其它方面的研究。MIT 也有个网络入口供人们读取 Materials Project 的数据。

Ceder 希望伟大的 MGI 计划能够完成它的使命。事实上,Ceder 已经看到一些成果了,他正在为一项新的电池材料申请专利,这对于成长中的 MGI 和电池技术开发来说都是很好的成绩。Ceder 认为互联网和大数据的加入能为这个计划带来无法预知的进步和发现,“当拥有这种组合的时候,你无法预测人们将会带给你什么。”


PS:WCG在哪?志愿计算又在哪?那么几句话就完了吗?这也能跟大数据扯上边?外国人也一样坑啊!




回复

使用道具 举报

发表于 2013-9-29 15:53:05 | 显示全部楼层
小白表示:看到第三段就看不下去了……
只是觉得:科学家好厉害哦!
然后就不关我事了……

说明作者重点就不在“志愿计算”上。

如果想真心宣传分布式计算,开头就要指出:
这不仅是科学家的事,你也可以参与哦
否则就和其他科技新闻没啥区别,纯属猎奇,看完就算了……






回复

使用道具 举报

发表于 2013-9-29 16:32:08 | 显示全部楼层
我的理解是,可能数据库保存有各种材料、元素的数据,通过搜索数据库,调入想要的材料数据,进行合成模拟,模拟出新的材料,然后在投入实际创造中。这就是大数据库功能,而分布式计算只是为了计算更多的材料数据,扩充大数据库的数据,增加更多数据而已,以方便科学家查阅各种数据。说白了应该就是云储存,一种大的数据中心。
回复

使用道具 举报

发表于 2013-9-29 20:04:44 | 显示全部楼层
就像建立元素周期表一样,觉得很可能建立材料周期表。当然会非常庞大
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 新注册用户

本版积分规则

论坛官方淘宝店开业啦~

Archiver|手机版|小黑屋|中国分布式计算总站 ( 沪ICP备05042587号 )

GMT+8, 2024-9-27 19:36

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表