Исследование алгоритмов понижения размерности на топологии объектов: UMAP & t-SNE.

Исследование алгоритмов понижения размерности на топологии объектов: UMAP & t-SNE.
Даты проведения
с 2021-01-06 по 2021-12-23

Методы. Мы использовали язык программирования Python для решения поставленных нами задач. Для генерации объектов в многомерных пространствах мы использовали библиотеку tadasets. Алгоритмы снижения размерности мы использовали из библиотек umap и sklearn.manifold. Для визуализации данных мы использовали библиотеку matplotlib

Выводы. Оба алгоритма достаточно хорошо сохраняют топологические характеристики объектов. Но UMAP с нашим количеством точек, из которых состоят объекты, (около 1000) работает вдвое быстрее, чем t-SNE. На некоторые моделях UMAP лучше сохраняет топологию исходного объекта, чем t-SNE (например, тор в 4D и узел-восьмерка)

Результаты нашего исследования могут быть применимы для многих областей где используются алгоритмы понижения размерности, например для распознавания языка жестов. Наш проект можно развивать в различных направлениях. Например, исследуя другие алгоритмы снижения размерностей (например, PCA или LDA) или улучшая метрику того, насколько алгоритм хорошо сохранил топологию объекта (например, используя библиотеки для определения топологических характеристик).

Понять, какой алгоритм понижения размерности лучше использовать для сохранения топологии объектов. Алгоритмы понижения размерности используются для понимания многомерных данных, а мы решили использовать их для превращения фигуры из n мерного пространства в ту же фигуру, только n-1 мерного пространства и смотрели на сохранение топологических свойств.
Понять что такое топологические характеристики ・ Научиться генерировать различные фигуры в пространствах различных размерностей ・ Применять на сгенерированных объектах алгоритмы понижения размерности ・ Научиться распознавать: сохранились ли топологические характеристики
Список литературы: How Mathematicians Use Homology to Make Sense of Topology Dimensionality Reduction for Data Visualization: PCA vs TSNE vs UMAP vs LDA How t-SNE works and Dimensionality Reduction UMAP documentation
О проекте

Проект опубликовал

Целевая аудитория

школьники 8-11 класс студенты специалисты преподаватели

Специализации

Программирование Изобретательство ТРИЗ

Области знаний

Математика и информатика Микроэлектроника