ChatGPT in Drug Discovery

是开发的一种语言模型 。这是一个在大型人类语言数据集上训练的机器学习模型 , 能够生成类似人类语言文本 。它可以用于各种自然语言处理任务 , 如语言翻译、文本摘要和问题回答 。在目前的工作中 , 我们讨论了在药物发现中的应用 。
1 药物发现是一个非常困难和复杂的过程 , 原因如下: 生物复杂性:人体是一个极其复杂的系统 , 在分子水平上理解它是如何工作的是困难的 。疾病是由多种因素引起的 , 寻找一种能够有效治疗疾病的药物是具有挑战性的;失败率高:大多数进入临床试验的药物都没有获得批准 。这是因为它们在测试过程中被发现无效 , 或者有不可接受的副作用;耗时昂贵:药物发现过程漫长且成本高昂 。严格的监管要求:药物开发过程受到严格监管 , 药物必须经过一系列临床前和临床试验 , 才能被批准使用;(5)药物开发的不可预测性:即使一种药物已经被确定并开发出来 , 也不能确定它在人体试验中是否会像预期的那样起作用 , 有时它可能会产生意想不到的副作用;缺乏新的靶点:许多已知的药物靶点已经被利用 , 寻找新的靶点变得越来越困难 。尽管面临这些挑战 , 研究人员仍在继续努力开发新的有效药物 。2 实验设计
设计了以下可应用于计算药物发现过程的计算问题:
计算复合多样性:当问Zn的多样性时 , GPT给出了正确的答案 。Chat GPT的答案如下:“锌是一种原子序数为30的过渡金属 , 它的电子构型中有30个电子 。Zn的电子构型为[Ar] 3d^10 4s^2 。由于所有的电子在轨道上都是成对的 , 所以Zn的多样性为1(单线态) 。这意味着HOMO中的所有电子都是成对的 , 分子中没有未成对的电子 。”因此 , Chat GPT可以用于密度泛函理论(DFT)量子力学计算中确定各种化合物的多重性;将转换为文件: Chat GPT成功地确定了 ()的 , 因此它可以用来将一种文件格式转换为另一种 。Chat GPT的答案是:“ 的化学名称是 , 其分子式是 ,  的简化分子输入行系统()符号是 “CC(=O)NC1=CC=C(C=C1)O” 。这个符号代表了分子中的原子和它们的联系”;生成和其他软件的输入文件:Chat GPT成功生成高斯软件的输入文件;生成对接的输入文件:成功地提供了软件的输入文件 , 并解释了其中提到的参数;查找pdb文件:可用于搜索pdb 。例如 , 它可以提供金属蛋白、DNA结合蛋白、刺突蛋白等的PDB id;在文献检索方面的帮助:的一个主要应用是在文献检索和列出与主题相关的具体发现;对接代码:它可以帮助编写基本代码 , 这些代码可以在药物发现的许多方面广泛使用(稍加修改);检查剽窃:可以用来检测剽窃 , 使研究过程和发表的研究工作顺利进行;机器学习和数据分析:它可以使用其API集成到程序或应用程序中 , 允许开发人员输入文本并接收由模型生成的响应 。可以使用、和c#等编程语言访问API 。此外 , 团队还发布了该模型的预训练版本 , 可以使用称为迁移学习的过程对特定任务进行微调;写一首关于计算化学的诗: 也可以写一首与计算化学相关的诗;创新:创新是研究领域的重要组成部分 , 只有提出不同的问题才能做到这一点 。在这方面 , 对于研究人员提出新颖的想法非常有用 。
Chat GPT无法回答以下复杂的问题:
Zinc 的PDB ID列表;锌离子通道的PDB ID;可以给出FASTA序列 , 但不能比较FASTA序列 , fasta序列可以从数据库中获得;ADMET性质:在这种情况下 , 它只能给出已知药物的性质 , 这些性质可以很容易地从各种药物数据库中获得 。