7 Papers | 英伟达64个A100训练StyleGAN-T；9类生成式AI模型综述

天承办公室 2023-02-27 发布于江苏

展开全文

机器之心 & ArXiv Weekly

参与：杜伟、楚航、罗若天

本周重要论文包括 6 大公司推出的 9 类生成式 AI 模式综述以及英伟达等机构推出的升级版 StyleGAN 等研究。

目录：

Quantum machine learning beyond kernel methods
Wearable in-sensor reservoir computing using optoelectronic polymers with through-space charge-transport characteristics for multi-task learning
Dash: Semi-Supervised Learning with Dynamic Thresholding
StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis
Open-Vocabulary Multi-Label Classification via Multi-Modal Knowledge Transfer
ChatGPT is not all you need. A State of the Art Review of large Generative AI models
ClimaX: A foundation model for weather and climate
ArXiv Weekly Radiostation：NLP、CV、ML 更多精选论文（附音频）

论文 1：Quantum machine learning beyond kernel methods

作者：Sofiene Jerbi 等
论文地址：https://www./articles/s41467-023-36159-y

摘要：本文中，来自奥地利因斯布鲁克大学的研究团队确定了一个建设性框架，该框架捕获所有基于参数化量子电路的标准模型：线性量子模型。

研究人员展示了使用量子信息论中的工具如何将数据重新上传电路有效地映射到量子希尔伯特空间中线性模型的更简单图像中。此外，根据量子比特数和需要学习的数据量来分析这些模型的实验相关资源需求。基于经典机器学习的最新结果，证明线性量子模型必须使用比数据重新上传模型多得多的量子比特才能解决某些学习任务，而核方法还需要多得多的数据点。

研究结果提供了对量子机器学习模型的更全面的了解，以及对不同模型与 NISQ 约束的兼容性的见解。

这项工作中研究的量子机器学习模型。

推荐：超越核方法的量子机器学习，量子学习模型的统一框架。

论文 2：Wearable in-sensor reservoir computing using optoelectronic polymers with through-space charge-transport characteristics for multi-task learning

作者：Xiaosong Wu 等
论文地址：https://www./articles/s41467-023-36205-9

摘要：传感器内多任务学习不仅是生物视觉的关键优点，也是人工智能的主要目标。然而，传统的硅视觉芯片存在大量时间以及能量开销。此外，训练传统的深度学习模型在边缘设备上既不可扩展也不可负担。

本文中，中科院和香港大学的研究团队提出了一种材料算法协同设计来模拟人类视网膜的学习范例，并且低开销。基于具有有效激子解离和贯穿空间电荷传输特性的瓶刷形半导体 p-NDI，开发了一种基于可穿戴晶体管的动态传感器储层计算系统，该系统在不同任务上表现出优异的可分离性、衰减记忆和回波状态特性。

与忆阻有机二极管上的「读出功能」相结合，RC 可识别手写字母和数字，并对各种服装进行分类，准确率分别为 98.04%、88.18% 和 91.76%（高于所有已报告的有机半导体）。

传统半导体和 p-NDI 的光电流响应比较，以及传感器内 RC 系统的详细半导体设计原理。

推荐：低能耗低时耗，中科院 & 香港大学团队使用新方法进行多任务学习的可穿戴传感器内储层计算。

论文 3：Dash: Semi-Supervised Learning with Dynamic Thresholding

作者：Yi Xu 等
论文地址：https://proceedings./v139/xu21e/xu21e.pdf

摘要：这篇论文创新性地提出用动态阈值（dynamic threshold）的方式筛选无标签样本进行半监督学习（semi-supervised learning，SSL）的方法，我们改造了半监督学习的训练框架，在训练过程中对无标签样本的选择策略进行了改进，通过动态变化的阈值来选择更有效的无标签样本进行训练。Dash 是一个通用策略，可以轻松与现有的半监督学习方法集成。

实验方面，我们在 CIFAR-10、CIFAR-100、STL-10 和 SVHN 等标准数据集上充分验证了其有效性。理论方面，论文从非凸优化的角度证明了 Dash 算法的收敛性质。

Fixmatch 训练框架