hero

ИИ и BigData. Урок 8

09 февраля 2026 г.

Описание отсутствует
Вопросов: 7
Что такое dataset в контексте машинного обучения?
  • Набор структурированных данных, подготовленных для обучения и проверки модели

  • Любой текстовый файл на диске

  • Название папки с картинками

  • Список установленных библиотек Python

Какой первый этап создания dataset по уроку 8?
  • Рисование логотипа проекта

  • Сбор данных, которые будут использоваться для обучения

  • Покупка нового компьютера

  • Настройка темы в PyCharm

Что такое предобработка данных (preprocessing)?
  • Стирание всех данных из таблицы

  • Очистка, нормализация, кодирование категорий и приведение данных к удобному формату

  • Скачивание случайных файлов из интернета

  • Шифрование токена бота

Какую роль играет one-hot-encoding («один горячий вектор») для категориальных данных?
  • Представляет категории в виде векторов из нулей и одной единицы, понятных нейросети

  • Сжимает изображения без потерь

  • Заменяет все числа на строки

  • Удаляет дубликаты строк в DataFrame

На какие части обычно разбивают данные при подготовке dataset?
  • Только на обучающую

  • Только на тренировочную и архивную

  • На визуальную и текстовую части

  • Обучающая, валидационная и тестовая выборки

Какие библиотеки используются в уроке 8 для работы с текстовым dataset и подготовкой к обучению?
  • Django, Flask и Jinja2

  • Pandas, TensorFlow и scikit-learn

  • PyGame, OpenGL и NumPy

  • TeleBot, Aiogram и Requests

Как связаны dataset и Telegram-бот в данном курсе?
  • Dataset хранит список чатов для рассылки

  • Бот сам создаёт dataset без участия человека

  • Обученная на dataset модель подключается к боту, который отвечает пользователю с её помощью

  • Dataset используется только для оформления интерфейса бота