Перейти к основному содержимому

Импорт и экспорт документов в NotionAI

Полное руководство по импорту документов из различных форматов, использованию embeddings для семантического поиска и экспорту данных с вложениями.


Содержание

  1. Импорт документов
  2. Embeddings — Семантический поиск
  3. Экспорт документов
  4. Архитектура и технические детали

Импорт документов

NotionAI поддерживает импорт документов из нескольких форматов. Каждый формат обрабатывается через систему transformers в BlockSuite.

Markdown (.md)

Статус: ✅ Полностью поддерживается

Как импортировать

  1. Откройте [taging.notionai.space] (https://staging.notionai.space/)
  2. Нажмите Импортровать в боковом меню или используйте диалог импорта
  3. Выберите файл .md, .docx или в другом доступном формате
  4. Документ будет создан автоматически

Что происходит под капотом

  • Используется MarkdownTransformer.importMarkdownToDoc()
  • Markdown парсится через MarkdownAdapter из BlockSuite
  • Создаётся новый документ с сохранением структуры заголовков, списков, кодовых блоков
  • Вложенные изображения и файлы обрабатываются отдельно

Ограничения

  • Сложные таблицы могут требовать ручной корректировки
  • Custom HTML внутри markdown может быть потерян

HTML (.html)

Статус: ✅ Полностью поддерживается

Как импортировать

  1. Откройте диалог импорта
  2. Выберите файл .html
  3. HTML будет преобразован в документ AFFiNE

Что происходит под капотом

  • Используется HtmlTransformer
  • HTML парсится и преобразуется в блоки BlockSuite
  • Сохраняются: заголовки, параграфы, списки, ссылки, изображения
  • CSS-стили не переносятся — используется тема AFFiNE

Ограничения

  • JavaScript не выполняется
  • Сложная вёрстка (grid, flexbox) упрощается до линейной структуры
  • Внешние ресурсы (картинки по URL) могут не загрузиться

DOCX (.docx)

Статус: ⚠️ Частично поддерживается (transformer существует, но не подключён к UI)

Это модуль используется для извлечения текста из DOCX при добавлении файлов в embeddings.

Рекомендации

  1. Вариант A: Конвертируйте DOCX → Markdown в Word/Google Docs, затем импортируйте .md
  2. Вариант B: Экспортируйте из Word в HTML, затем импортируйте .html
  3. Вариант C: Используйте AI Copilot — загрузите DOCX как файл в контекст, и текст будет извлечён

NotionAI Snapshot (.notionai.zip)

Статус: ✅ Полностью поддерживается (родной формат)

Как импортировать

  1. Откройте диалог импорта
  2. Выберите файл .notionai.zip
  3. Все документы из снапшота будут восстановлены

Что происходит под капотом

  • Используется ZipTransformer.importDocs()
  • Восстанавливается полная структура workspace
  • Сохраняются все метаданные, связи между документами, вложения
  • Это наиболее полный способ импорта/экспорта

Когда использовать

  • Перенос данных между установками Notion AI
  • Бэкап и восстановление
  • Миграция с локальной версии на облачную (и наоборот)

Notion Export (ZIP)

Статус: ✅ Поддерживается

Как импортировать

  1. Экспортируйте данные из Notion (Notion → Settings → Export → HTML & Markdown)
  2. В Notio AI выберите импорт ZIP-архива
  3. Используется NotionHtmlTransformer для обработки

Что сохраняется

  • Структура страниц
  • Текст и форматирование
  • Вложенные страницы
  • Изображения (если включены в экспорт)

Ограничения

  • Notion databases требуют ручной настройки
  • Custom Notion-блоки могут не конвертироваться
  • Связи между страницами могут требовать корректировки

Embeddings — Семантический поиск

Embeddings позволяют AI Copilot понимать смысл ваших документов и находить релевантную информацию через семантический поиск.

Как работают embeddings

Документ/Файл

[Текст извлекается]

[Разбивается на чанки] ← packages/backend/native/src/doc_loader.rs

[Embedding API] ← OpenAI / совместимый провайдер

[Векторное представление (массив чисел)]

[Сохраняется в БД] ← AiWorkspaceFileEmbedding

[Семантический поиск] ← matchFiles() / matchWorkspaceDocs()

Как AI использует embeddings

  1. Запрос пользователя → "Как настроить аутентификацию?"
  2. Embedding запроса → векторное представление
  3. Поиск по cosine similarity → находятся релевантные чанки
  4. Контекст добавляется в промпт → AI отвечает с учётом ваших документов

Экспорт документов

Notion AI поддерживает несколько форматов экспорта, включая ZIP-архивы с изображениями.

Экспорт в ZIP с изображениями

Статус: ✅ Полностью поддерживается

Экспорт в Markdown

Статус: ✅ Полностью поддерживается

Как экспортировать

  1. Откройте документ
  2. Нажмите ExportMarkdown
  3. Скачается файл {docTitle}.md

Что сохраняется

  • ✅ Заголовки (H1-H6)
  • ✅ Параграфы и текст
  • ✅ Списки (нумерованные, маркированные)
  • ✅ Кодовые блоки с подсветкой синтаксиса
  • ✅ Таблицы
  • ✅ Ссылки
  • ⚠️ Изображения — только если есть вложения (см. ZIP экспорт)

Экспорт в HTML

Статус: ✅ Полностью поддерживается

Как экспортировать

  1. Откройте документ
  2. Нажмите ExportHTML
  3. Скачается файл {docTitle}.html или {docTitle}.zip (если есть изображения)

Что сохраняется

  • ✅ Полная HTML структура
  • ✅ Inline стили (базовые)
  • ✅ Изображения (в ZIP с папкой assets)
  • ✅ Ссылки и якоря
  • ❌ JavaScript не включается

Экспорт в PDF

Статус: ✅ Полностью поддерживается

Как экспортировать

  1. Откройте документ
  2. Нажмите ExportPDF
  3. Скачается файл {docTitle}.pdf

Что сохраняется

  • ✅ Полное визуальное представление
  • ✅ Изображения и диаграммы
  • ✅ Стили и форматирование
  • ✅ Печать через printToPdf()

Экспорт ZIP не содержит изображений

Проблема: Скачивается только .md файл без ZIP

Решение:

  • Это ожидаемое поведение, если в документе нет изображений
  • ZIP создаётся только если result.assetsIds.length > 0
  • Проверьте, что изображения действительно вложены в документ

DOCX импорт показывает "Coming soon"

Проблема: Кнопка DOCX неактивна

Решение:

  • DOCX трансформер существует, но не подключён к UI
  • Используйте обходные пути:
    1. Конвертируйте DOCX → Markdown в Word
    2. Экспортируйте из Word в HTML
    3. Загрузите DOCX как файл в AI Copilot контекст