网易首页 > 网易号 > 正文 申请入驻

npj: 机器学习—预测识别单壁碳纳米管的DNA序列

0
分享至

新的机器学习模型,有可能为更普遍的序列选择问题提供新的途径。

DNA 具有分散和筛选不同手性和偏手性的单壁碳纳米管的特性,这将带来诸多应用。为寻找能够筛选任一给定类型碳管的DNA序列,人们已经开展了大量工作,并在理解DNA/碳管复合物结构及热力学方面取得了很大进展。然而,从头预测识别序列的方法尚难以实现,而且通过搜索巨大的单链DNA库来寻找序列的成功率非常低。

来自美国Lehigh大学化学与生物分子工程系的Anand Jagota等,基于现有实验序列数据集,报告了一种用机器学习分析来预测识别DNA序列的有效方法。为便于分析、解释,他们将SWCNT识别的DNA序列限制为只有2种碱基组合(C&T)的、12个碱基构成的短序列。以已知数据训练机器学习模型,并将实验测试过的新序列数据集添加到原始数据集,重新训练模型。通过交叉验证和新测试集上的预测误差来评估预测性能,并通过特征表示方法改进模型性能。结果显示准确预测识别序列的频率从原始训练集的10%显著提升到> 50%。他们所获得的机器学习模型,有可能为更普遍的序列选择问题提供新的途径。

该文近期发表于npj Computational Materials 5: 3 (2019),英文标题与摘要如下,点击https://www.nature.com/articles/s41524-018-0142-3可以自由获取论文PDF。

Learning to predict single-wall carbon nanotube-recognition DNA sequences

Yoona Yang, Ming Zheng & Anand Jagota

Abstract DNA/single-wall carbon nanotube (SWCNT) hybrids have enabled many applications because of their special ability to disperse and sort SWCNTs by their chirality and handedness. Much work has been done to discover sequences which recognize specific chiralities of SWCNT, and significant progress has been made in understanding the underlying structure and thermodynamics of these hybrids. Nevertheless, de novo prediction of recognition sequences remains essentially impossible and the success rate for their discovery by search of the vast single-stranded DNA library is very low. Here, we report an effective way of predicting recognition sequences based on machine learning analysis of existing experimental sequence data sets. Multiple input feature construction methods (position-specific, term-frequency, combined or segmented term frequency vector, and motif-based feature) were used and compared. The transformed features were used to train several classifier algorithms (logistic regression, support vector machine, and artificial neural network). Trained models were used to predict new sets of recognition sequences, and consensus among a number of models was used successfully to counteract the limited size of the data set. Predictions were tested using aqueous two-phase separation. New data thus acquired were used to retrain the models by adding an experimentally tested new set of predicted sequences to the original set. The frequency of finding correct recognition sequences by the trained model increased to >50% from the ~10% success rate in the original training data set.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
七年前,劳荣枝在厦门一家健身房的自拍照

七年前,劳荣枝在厦门一家健身房的自拍照

王二哥老搞笑
2024-04-19 13:20:50
印度现史前超大型蛇化石,体型远超现存巨蟒

印度现史前超大型蛇化石,体型远超现存巨蟒

弱肉强食法则
2024-04-19 08:09:37
世界杯:4月19日赛程公布!国乒冲击四强,迎战张禹珍、平野美宇

世界杯:4月19日赛程公布!国乒冲击四强,迎战张禹珍、平野美宇

拳击时空
2024-04-19 06:00:32
阿森纳出局,阿尔特塔揪出3大水货:总身价高达2.8亿欧,名不副实

阿森纳出局,阿尔特塔揪出3大水货:总身价高达2.8亿欧,名不副实

球场没跑道
2024-04-18 12:12:12
现实里的这个地方,居然和魔兽的场景一模一样,看出来是哪了吗?

现实里的这个地方,居然和魔兽的场景一模一样,看出来是哪了吗?

苹果牛看游戏
2024-04-16 19:07:01
70岁离异老太惨死,法医检测体内男性DNA,竟与老太自己高度吻合

70岁离异老太惨死,法医检测体内男性DNA,竟与老太自己高度吻合

苏大强专栏
2024-03-27 22:12:23
换帅,重建!AC米兰核心被“摆上货架”!新主帅携5000万中锋来投

换帅,重建!AC米兰核心被“摆上货架”!新主帅携5000万中锋来投

头狼追球
2024-04-19 10:23:21
做酒店前台时你都吃到什么惊天大瓜?看完网友真实经历,简直绝了

做酒店前台时你都吃到什么惊天大瓜?看完网友真实经历,简直绝了

今日搞笑分享
2024-04-18 14:39:36
俄国认为:《尼布楚条约》是耻辱,黑龙江流域自古就是他们的领土

俄国认为:《尼布楚条约》是耻辱,黑龙江流域自古就是他们的领土

黎庶文史
2024-04-17 23:44:19
还真是越来越没底线了呢

还真是越来越没底线了呢

麻辣婊
2024-04-18 00:54:47
国乒新秀入韩国籍,成韩国“大魔王”,扬言要击败中国

国乒新秀入韩国籍,成韩国“大魔王”,扬言要击败中国

林子说事
2024-04-17 14:44:54
耻辱!日媒评世界杯:张本美和淘汰王艺迪,证实国乒弃用决定明智

耻辱!日媒评世界杯:张本美和淘汰王艺迪,证实国乒弃用决定明智

室内设计师阿喇
2024-04-19 12:51:39
“岁运并临”的年份到底好不好?

“岁运并临”的年份到底好不好?

西风独醉
2024-04-18 10:52:25
睡觉时出现这5个迹象,说明你的血糖高了!很多人都不知道

睡觉时出现这5个迹象,说明你的血糖高了!很多人都不知道

39健康网
2024-04-18 19:40:03
九华山坐缸尼姑是药王菩萨转世,曾参加抗美援朝,开缸后震惊世人

九华山坐缸尼姑是药王菩萨转世,曾参加抗美援朝,开缸后震惊世人

真实故事汇
2024-04-09 10:10:40
蔡英文的“卸任”民调出来了!

蔡英文的“卸任”民调出来了!

寥寥无几溜了
2024-04-18 00:20:01
车市太惨烈了,小鹏P7时隔半年掉价8w,车主有苦难言

车市太惨烈了,小鹏P7时隔半年掉价8w,车主有苦难言

买车家
2024-04-18 10:25:34
董宇辉登上北京国际电影节的舞台,全网都在感谢东方小孙

董宇辉登上北京国际电影节的舞台,全网都在感谢东方小孙

阿甘笔记
2024-04-19 13:12:45
快船总裁:如果有严重受伤风险 我们不会让小卡或其他任何人上场

快船总裁:如果有严重受伤风险 我们不会让小卡或其他任何人上场

直播吧
2024-04-19 09:50:34
连自己人都坑!建业集团信托违约,一大批员工哀嚎!

连自己人都坑!建业集团信托违约,一大批员工哀嚎!

小马哥谈体育
2024-04-19 03:23:05
2024-04-19 14:54:44
知社学术圈
知社学术圈
海归学者发起的学术交流平台
3224文章数 106784关注度
往期回顾 全部

科技要闻

Pura 70卖爆,华为要夺回苹果拿走的一切

头条要闻

为完成"市场主体倍增"要求 有村支书办理20张营业执照

头条要闻

为完成"市场主体倍增"要求 有村支书办理20张营业执照

体育要闻

安息吧勇士王朝,2013-2023

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

围猎三丰智能的神秘基金设骗局转移资产

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

旅游
教育
健康
房产
游戏

旅游要闻

西宁“下南关”:高原老街的烟火气

教育要闻

24年 一消管理坑题 83

这2种水果可降低高血压死亡风险

房产要闻

国企下场,海口疯狂抢地!

尴尬!LPL惨遭无视?韩媒爆料:沙特电竞杯没有邀请LPL战队

无障碍浏览 进入关怀版