Фрагменты, оценки и экспорт

Фрагменты — единица, которую вы проверяете. Экспорты — единица, которую вы переиспользуете.

Knowlume особенно полезен, когда в источнике много воды. Вместо чтения или просмотра всего материала используйте фильтры, чтобы найти фрагменты, которые воспроизводимы, небанальны, содержат явные внешние источники или иначе стоят сохранения.

Эта страница объясняет основной workflow после завершения обработки источника. Первый полный запуск описан в Быстрый старт.

Анатомия фрагмента

Фрагмент обычно содержит:

  • заголовок;
  • ссылку на источник;
  • Markdown-тело;
  • значения оценок;
  • опциональное объяснение оценки;
  • опциональный скриншот или изображение, если доступно.

Панель Details — главный источник истины при проверке. Список оптимизирован для быстрого triage.

Оси оценок

Каждая оценка — целое число от 0 до 10.

Воспроизводимость

Высокая воспроизводимость означает, что читатель может проверить, повторить или применить фрагмент.

Примеры высокой воспроизводимости:

  • процедура с ясными шагами;
  • измеримое утверждение с контекстом;
  • правило с условиями и исключениями.

Низкая воспроизводимость обычно означает, что фрагмент слишком расплывчатый, мотивационный, биографический, мненческий или плохо проверяемый.

Используйте эту оценку, когда вам нужен материал, который можно перенести в свою работу: процедуры, playbooks, чек-листы, детали реализации, правила принятия решений и примеры с ясными условиями.

Оригинальность

Высокая оригинальность означает, что фрагмент не является очевидным фоном. Внутри Knowlume это публичное отображение обратной метрики: чем ниже внутренняя банальность, тем выше оригинальность.

Примеры высокой оригинальности:

  • неожиданные ограничения;
  • практическое различие;
  • нетривиальный синтез;
  • деталь, меняющая реализацию или решение;
  • редкий профессиональный опыт;
  • междисциплинарная связь;
  • контринтуитивный урок или ошибка.

Низкая оригинальность не означает, что фрагмент неверен. Это значит, что его может быть не стоит экспортировать.

Как это работает в epistack:

  1. Из фрагмента извлекается причинно-следственная связка: причина, контекст и реальное следствие.
  2. Причина и контекст очищаются так, чтобы они не раскрывали следствие напрямую.
  3. Модель получает только причину и контекст и предсказывает пять возможных следствий.
  4. Реальное следствие сравнивается с этими предсказаниями.
  5. Если следствие легко предсказано, фрагмент считается более банальным. Если следствие неожиданное, специфичное или не попало в предсказания, фрагмент получает более высокую оригинальность.

Если причина и контекст уже слишком сильно раскрывают следствие, epistack не считает это "оригинальностью". В таком случае он консервативно повышает банальность, чтобы не награждать фрагмент за утечку ответа.

Источниковость

Высокая источниковость означает, что во фрагменте явно упомянуты внешние источники или сущности, к которым можно вернуться: книги, продукты, сервисы, инструменты, бренды, библиотеки, статьи, сайты или URL.

Примеры сильной источниковости:

  • название книги, статьи, библиотеки или инструмента;
  • ссылка на сайт или URL;
  • упоминание продукта, сервиса, бренда или исследования;
  • список конкретных ресурсов, которые стоит открыть отдельно.

Низкая источниковость не означает, что фрагмент плохо подтвержден. Она означает, что внутри фрагмента мало явных внешних упоминаний или ссылок. Например, сильный практический совет без названных источников может иметь высокую воспроизводимость и оригинальность, но низкую источниковость.

Текущая оценка sourcesness в epistack считается просто: извлекаются уникальные явные упоминания источников и URL, затем оценка растет на 2 пункта за каждое упоминание до максимума 10.

Стратегия фильтрации

Начинайте широко, затем сужайте.

Рекомендуемый первый проход:

reproducibility >= 5
originality >= 5
sourcesness >= 5

Используйте режим sum для исследования. Он мягче и помогает находить кандидатов.

Используйте режим product, когда нужны строгие quality gates. Он штрафует фрагменты, слабые хотя бы по одной оси.

Комбинации фильтров

Используйте разные комбинации фильтров под разные цели:

Цель Полезный паттерн фильтров
Собрать практическую базу знаний Высокая воспроизводимость + высокая оригинальность
Изучить новую область Сначала воспроизводимость, затем оригинальность
Найти зацепки для исследования Сначала оригинальность, затем ручная проверка воспроизводимости
Собрать ссылки, инструменты и первоисточники Сначала sourcesness
Быстро оценить слабый источник Ищите источники, где почти нет сильных фрагментов

Для длинного видео или подкаста даже хороший источник может содержать всего несколько отличных фрагментов. Это нормально. Цель — не тратить час, чтобы обнаружить, что полезными были три минуты.

Стратегия выбора

Выбирайте фрагмент, если он:

  • полезен вне исходного материала;
  • достаточно конкретен, чтобы его цитировать или применять;
  • имеет достаточно контекста для проверки;
  • не дублирует более сильный фрагмент;
  • входит в полезную последовательность с соседними фрагментами.

Пропускайте фрагмент, если он:

  • общий;
  • неподдержанный;
  • слишком узкий для переиспользования;
  • избыточный;
  • понятен только после чтения всего источника.

Если фрагмент полезен, но ему не хватает контекста, посмотрите соседние фрагменты. Иногда лучший экспорт — это небольшой кластер: основная идея плюс вводная, оговорка или пример рядом с ней.

Экспорт в Markdown

В веб-приложении поддерживается такой поток:

  1. Выбрать фрагменты.
  2. Сохранить выборку.
  3. Экспортировать Markdown.
  4. Скачать артефакт или отправить его через webhook.

Экспорт предназначен для вставки в заметки, передачи коллегам или обработки downstream-системами.

Хороший экспорт компактный. В нем достаточно контекста, чтобы переиспользовать идею позже, но это не весь транскрипт или вся статья.

Доставка через вебхук

Пользователь может настроить Integration Webhook в settings.

Режимы доставки:

Режим Поведение
File only Экспорт создает скачиваемый артефакт.
Webhook only Payload экспорта отправляется на настроенный URL.
Webhook and file Используются оба пути доставки.

Webhook-доставка асинхронна. Экспорт может успешно завершиться даже если webhook-доставка позже упадет после retry.

Payload webhook содержит выбранный Markdown, metadata источника, metadata экспорта и file URL, если включена файловая доставка.

Экспорт через публичный программный интерфейс

Public API поддерживает Markdown-экспорт в рамках одного источника. Клиент может:

  1. отправить URL-источник;
  2. опрашивать статус источника;
  3. получить отфильтрованные фрагменты;
  4. поставить Markdown-экспорт в очередь;
  5. опрашивать статус экспорта;
  6. прочитать file URL или webhook-style payload.

Примеры запросов есть в Интеграции и API.

Частые ошибки

Не экспортируйте до статуса источника succeeded.

Не воспринимайте оценки как абсолютную истину. Используйте их как систему triage.

Не рассчитывайте на browser folder export, если браузер не поддерживает выбор директории.

Не используйте webhook-доставку как единственную копию важного содержимого, если принимающая система не мониторится.