普渡大学的研究人员开发了更快,更好的数据分析算法
印第安纳州WEST LAFAYETTE – 每两秒钟,测量美国电网的传感器收集3 PB的数据 – 相当于300万千兆字节。当关键信息存储在无法访问的数据库中时,该规模的数据分析是一项挑战。
但普渡大学的研究人员正在研究一种解决方案,将量子算法与小规模量子计算机上的经典计算相结合,以加速数据库的可访问性。他们使用的是美国能源部国家实验室传感器的数据,称为相量测量单元,用于收集有关电压,电流和发电的电网信息。因为这些值可以变化,所以保持电网稳定包括连续监测传感器。
Sabre Kais是化学物理学教授和首席研究员,他将领导开发新的量子算法,用于计算电网产生的大量数据。“用于分析数据的非量子算法可以预测电网状态,但随着越来越多的相量测量单元部署在电网中,我们需要更快的算法,” 计算机科学教授和该项目的共同研究员Alex Pothen说。“用于数据分析的量子算法有可能在理论意义上大大加快计算速度,但在实现可处理如此大量数据的量子计算机方面仍存在巨大挑战。”研究团队的方法具有许多实际应用的潜力,例如帮助行业优化供应链和物流管理。它还可以使用称为量子玻尔兹曼机器的人工神经网络发现新的化学和材料发现。这种神经网络用于机器学习和数据分析。
“我们已经开发出一种混合量子算法,采用量子Boltzmann机器来获得精确的电子结构计算,”Kais说。“我们有概念证据显示小分子系统的结果,这将使我们能够筛选分子并加速新材料的发现。”
周三在Nature Communications杂志上发表了一篇概述这些结果的论文。
机器学习算法已被用于计算数百万小分子的近似电子特性,但控制这些分子系统对化学物理学家来说是一个挑战。凯斯和合作研究者陈勇,该主任普渡大学量子中心和物理学和天文学和电气和计算机工程教授,是相信他们的量子机器学习算法可以解决这个问题。
他们的算法也可用于优化太阳能农场(solar farms)。据电气和计算机工程教授,该项目的共同研究员Muhammad Alam称,太阳能电站的寿命取决于气候,因为太阳能电池每年因天气而退化。使用量子算法可以更容易地确定特定地理位置的太阳能发电场和其他可持续能源技术的寿命,并有助于提高太阳能技术的效率。
此外,该团队希望启动一个由外部资助的产业 – 大学合作研究中心(IUCRC),以促进量子机器学习的进一步研究,以进行数据分析和优化。IUCRC的好处包括利用研究机构 – 企业合作伙伴关系,扩展材料科学研究以及采取市场激励措施。他说,进一步研究量子机器学习数据分析是必要的,然后才能用于工业实际应用,IUCRC将取得切实进展。
“我们正在为这种数据分析开发经典算法,我们希望它们得到广泛应用,”Pothen说。“量子算法是高风险,高回报的研究,很难预测这些算法将在什么时间框架内实际应用。”
该团队的研究项目是普渡大学综合数据科学计划选出的八个项目之一,为期两年。该计划将鼓励跨学科合作,并以普渡大学的优势为基础,将大学定位为数据科学研究的领导者,并将重点放在以下四个领域之一:医疗保健; 防御; 道德,社会和政策; 基本原理,方法和算法。综合数据科学计划的研究重点由普渡大学的探索公园主办。
“这是将机器学习与量子计算相结合的激动人心的时刻,”Kais说。“最近在构建量子计算机方面取得了令人瞩目的进展,量子机器学习技术将成为在大数据中寻找新模式的有力工具。”
关于探索公园
Discovery Park是一个开放的实验室,专注于应对全球挑战的跨学科合作。其使命是加速改变世界的跨学科研究,丰富变革性教育,推动创新转化为教师,学生和员工的商业化活动。
资料来源: Sabre Kais,765-494-5965,kais @purdue.edu
作家:莎拉奥尔森