1. Исследование недостаточности и переобучения в генеративно-состязательных сетях Вассерштейна(arXiv)

Автор: Бен Адлам, Чарльз Вайль, Амол Капур.

Аннотация: мы исследуем недостаточное и переоснащение в генеративно-состязательных сетях (GAN), используя дискриминаторы, невидимые генератором, для измерения обобщения. Мы обнаружили, что производительность модели дискриминатора оказывает значительное влияние на качество модели генератора, и что плохая производительность генератора совпадает с недостаточной подгонкой дискриминатора. Вопреки нашим ожиданиям, мы обнаружили, что генераторы с большими возможностями модели по отношению к дискриминатору не демонстрируют признаков переобучения на CIFAR10, CIFAR100 и CelebA.

2.Использование генеративно-состязательных сетей Вассерштейна для моделирования моделирования методом Монте-Карло(arXiv)

Автор:Сьюзан Этей, Гвидо Имбенс, Джонас Мецгер, Эван Манро

Аннотация: Когда исследователи разрабатывают новые эконометрические методы, общепринятой практикой является сравнение эффективности новых методов с эффективностью существующих методов в исследованиях Монте-Карло. Достоверность таких исследований Монте-Карло часто ограничена из-за свободы исследователя в выборе дизайна. В последние годы в литературе по машинному обучению появился новый класс генеративных моделей, названных генеративно-состязательными сетями (GAN), которые можно использовать для систематического создания искусственных данных, которые точно имитируют реальные наборы экономических данных, ограничивая при этом степени свободы для исследователя и, возможно, соблюдение гарантий конфиденциальности в отношении данных обучения. Кроме того, если исследователя-прикладника интересует эффективность конкретного статистического метода на конкретном наборе данных (помимо его теоретических свойств в больших выборках), он может пожелать оценить эффективность, например степень охвата доверительных интервалов или систематическую ошибку. оценщика, используя смоделированные данные, которые напоминают ее настройки. Чтобы проиллюстрировать эти методы, мы применяем GAN Вассерштейна (WGAN) для сравнения ряда различных оценок средних эффектов лечения в условиях несмешанности в трех разных условиях (соответствующих трем реальным наборам данных) и представляем методологию оценки надежности результатов. В этом примере мы обнаруживаем, что (i) не существует ни одного оценщика, который превосходил бы другие во всех трех условиях, поэтому исследователи должны адаптировать свой аналитический подход к заданным условиям, и (ii) систематические симуляционные исследования могут быть полезны для выбора среди конкурирующих методы в данной ситуации.