GP × AI Research Program

От содержательно-генетической логики Щедровицкого к технологизированному мышлению: автоматизация научных открытий и новое поколение reasoning-моделей
v2.0 — 11 мая 2026  |  Алексей Макин  |  Проект METHODOLOGY  |  4 фазы
Две стратегические цели
Цель 1 — Фабрика знания

Automated Scientific Discovery System

Технологизированное производство научного знания: извлечь из материалов ГП все операции мышления, связанные с научными открытиями, построением теорий, проверкой гипотез — и превратить их в воспроизводимый конвейер, ускоряющий нас в любых научных направлениях.

Цель 2 — Новое поколение AI

GP-Enhanced MAS / LLM

Встроить извлечённые и технологизированные операции мышления в мультиагентные системы или LLM — чтобы слабые модели достигали прорывного уровня рассуждений (научные открытия, построение теорий, исследования) — того, для чего нужен AGI или даже ASI.

Три тематических направления извлечения
Тема 1

Производство научного знания

Всё, что касается научных открытий, построения теорий, проверки гипотез, ситуаций разрыва, замещения.

  • Нисходящее разложение текстов
  • Операции: DEFINITION, REFUTATION, REPAIR, SYNTHESIS
  • Генетические карты научных рассуждений
  • Цикл: определение → проверка → разрушение → починка
Тема 2

Теория мышления и деятельности

Что ГП сформулировал: содержательно-генетическая логика, СМД, его программа и план развития направлений.

  • Содержательно-генетическая логика
  • Схема мыследеятельности (СМД)
  • Рефлексия и рефлексивное управление
  • Программа и проект развития
Тема 3

Вспомогательный корпус

Системное мышление, организационное управление, антропотехника, Лефевр — контекст и инструментарий.

  • Технология системного мышления
  • Организационно-управленческий контекст
  • Антропотехника и управление знаниями
  • Рефлексивный анализ (Лефевр)
Архитектурная формула (по модели Palantir)
Научные тексты GP-разложение Типизированный граф операций Мета-алфавит

Стохастический AI внутри детерминистского каркаса операций мышления

Корпус исходных материалов

ПапкаДокументТемаСтатус
1/Языковое мышление и методы его исследования (370 с.)1+2Глава 3 прочитана
От логики науки к теории мышления2Не начато
На перекрёстке мысли2Не начато
Мифопсихология: От теории мышления к теории деятельности2Не начато
0/Путеводитель ОРУ (тома 1-2)3Навигаторы созданы
Рефлексия (Лефевр)3Дельта извлечена
2/Рельсы, трубы, провода3Не начато
Энергия промышленного роста3Не начато
Первым делом самолёты3Не начато
Знания в управлении3Не начато
О методе управления знаниями3Не начато
Корпоративная антропотехника3Не начато
3/Технология системного мышления2+3Не начато
10-й том (избранные труды)1+2Не начато
PROGRAM/The Rise of the Era of Intellectual Technologies1HTML-оверлей создан
Stanford/12 статей (Analysis of Knowledge, Confirmation, Scientific Revolutions...)1 (пилот)1 статья разложена

Текущий уровень готовности

4
артефакта создано
(MD-документы)
1
пилотный эксперимент
(11 операций, 8 типов)
6
типов сопоставления
(таксономия S1-S6)
~20
материалов в корпусе
(PDF + DOCX)
1
Экстракт, визуализация результатов и валидация
3–5 недель  |  Скиллы + экстракция из книг + проектирование представлений + контрольная проверка
A. Инструменты экстракции
1.1

Скилл GP-разложения

Оформить алгоритм из GP_DECOMPOSITION_ALGORITHM_AND_EXPERIMENT.md как воспроизводимый скилл с жёсткой валидацией: обязательные поля, DAG-проверка, классификация S1-S6, JSON-выход.
Выход: SKILL.md + валидатор (Python/TS)
Скилл Task #10
1.2

Скилл тематического экстракта

Скилл для систематического чтения PDF-книг ГП порциями (20 страниц): извлекает всё по заданной теме (1/2/3), складывает в JSON + MD. Не GP-разложение, а тематическая экстракция.
Выход: SKILL.md (thematic-extractor)
Скилл
B. Экстракция из материалов ГП
1.3

Полный экстракт из диссертации «Языковое мышление»

Дочитать главы 1-2 (с. 37-234). Глава 3 уже обработана. Полная карта тем 1-2-3 из диссертации.
Выход: DISSERTATION_FULL_EXTRACT.md
Скилл 1.2 Гл. 3 готова
1.4

Экстракт из «От логики науки к теории мышления»

Программа ГП по развитию теории мышления. Извлечь: (а) теорию мышления, (б) проект и план, (в) производство научного знания.
Выход: BOOK_OT_LOGIKI_EXTRACT.md
Скилл 1.2
1.5

Экстракт из «Мифопсихология» + «На перекрёстке мысли»

Переход от теории мышления к СМД. Генезис, программа, методологические предостережения.
Выход: BOOK_MIFPSYCH_EXTRACT.md + BOOK_PEREKRESTOK_EXTRACT.md
Скилл 1.2
1.6

Экстракт из «Технология системного мышления» + 10-й том

Системное мышление как процедура. Избранные тексты по темам 1-2.
Выход: BOOK_SYST_EXTRACT.md + BOOK_TOM10_EXTRACT.md
Скилл 1.2
1.7

Сборка: тематический свод по трём темам

Из всех экстрактов (1.3–1.6) — три консолидированных документа. Кросс-ссылки, устранение дублей, выделение противоречий.
Выход: THEME_1_PRODUCTION_OF_KNOWLEDGE.md
THEME_2_THEORY_OF_THINKING.md
THEME_3_AUXILIARY_CORPUS.md
Ручная сверка
1.8

Экстракт из вспомогательного корпуса (папка 2/)

6 книг. Быстрый проход: только то, что относится к темам 1-3. Фоновая задача.
Выход: FOLDER_2_EXTRACTS/ (6 файлов)
Скилл 1.2 Низкий приоритет
C. Проектирование и создание визуализаций результатов
1.9

Спроектировать систему представлений результатов GP-разложения

Определить, как именно визуально показывать результат работы: какие графы, какие диаграммы, какие таблицы, какие интерактивные представления нужны, чтобы человек мог изучить результат и отнестись к нему. Дизайн-документ с макетами представлений.
Выход: VISUALIZATION_DESIGN.md — спецификация 5–7 типов визуализаций
Визуализация Дизайн
1.10

Визуализация единичного GP-разложения (HTML)

Интерактивный HTML для одного Decomposition: (а) граф операций — узлы = операции, рёбра = inputs/outputs, цвет = тип, размер = генетическая сложность; (б) timeline основной линии — горизонтальная лента с операциями; (в) карточка операции — при клике на узел: полная двухчастная структура (сопоставление + отнесение); (г) алфавит-бар — частотная гистограмма типов. Протестировать на данных пилота (Stanford).
Выход: GP_DECOMPOSITION_VIEWER.html (D3.js)
Визуализация Данные пилота есть
1.11

Визуализация кросс-текстового сравнения

HTML для сравнения нескольких разложений: (а) radar chart доменных сигнатур (доля каждого типа операций); (б) генетическая карта — DAG типов с рёбрами «проще → сложнее»; (в) паттерны-ленты — визуализация повторяющихся цепочек операций; (г) матрица сходства текстов по алфавитным профилям.
Выход: GP_CROSS_COMPARISON_VIEWER.html (D3.js)
Визуализация
1.12

Визуализация тематических сводов (HTML)

Для результатов шага 1.7: интерактивная карта знаний по каждой теме. Связи между концепциями, кластеры, источники. Чтобы можно было «войти» в тему и увидеть структуру.
Выход: THEME_KNOWLEDGE_MAP.html (force-graph)
Визуализация
D. Валидация: контрольный эксперимент
1.13

Отобрать контрольный набор текстов (3–5 текстов)

Короткие, разнородные тексты для контрольного прогона: 1 из аналитической философии (Stanford), 1 из экспериментальной физики, 1 из биологии/медицины, 1 из математики, 1 из экономики. По 1500–3000 слов каждый.
Выход: VALIDATION_CORPUS/ (3-5 текстов)
Валидация Ручной отбор
1.14

Ручной GP-прогон: разложение по инструкции (не скиллом)

Проделать GP-разложение тех же текстов вручную по инструкции — шаг за шагом в чате, с возможностью останавливаться, обсуждать неоднозначности, принимать решения. Это «золотой стандарт» — максимально тщательный прогон.
Выход: VALIDATION_MANUAL/ (3-5 JSON Decomposition) — эталонные разложения
Валидация Ручной
1.15

Автоматический GP-прогон: разложение скиллом

Прогнать те же контрольные тексты через скилл (1.1) — автономно, без вмешательства. Получить второй набор разложений.
Выход: VALIDATION_AUTO/ (3-5 JSON Decomposition)
Валидация Скилл 1.1
1.16

Сравнительный анализ: ручной vs автоматический

Для каждого текста сравнить: (а) совпадение числа операций, (б) совпадение типов (precision/recall по алфавиту), (в) совпадение основной линии, (г) совпадение генетической карты. Визуализировать расхождения (1.10). Определить: где скилл теряет качество и нужна ли его доработка.
Выход: VALIDATION_REPORT.md + VALIDATION_COMPARISON.html
Валидация Визуализация

Gate 1: Готовность к инфраструктуре

2
Инфраструктура: база данных, пайплайн, дашборд стадий
2–3 недели  |  Поднять хранилище, конвейер загрузки, визуализацию прогресса
2.1

Формализация JSON-LD схемы онтологии

По спецификации из GP_OPERATIONAL_LAYER_ONTOLOGY.md: все Object Types (Operation, OperationType, SopostavlenieType, GeneticLink, OperationPattern, Domain, Concept, Etalon) → JSON-LD. Это контракт для всех компонентов системы.
Выход: gp-ontology-schema.jsonld
Инфраструктура
2.2

База данных: граф операций

Поднять графовую БД для хранения всех GP-разложений. Варианты: (а) Neo4j (идеальный, если есть сервер), (б) SQLite + JSON (лёгкий, для старта), (в) NetworkX-граф в pickle (для экспериментов). Typed nodes + typed edges + CRUD + запросы по типам/доменам/паттернам.
Выход: GP_GRAPH_DB/ + API (Python SDK)
Инфраструктура
2.3

Конвейер загрузки (Hydrate pipeline)

Автоматизированный пайплайн: JSON Decomposition → валидация схемы → Entity Resolution (маппинг на мета-алфавит) → загрузка в граф → обновление статистики. Скрипт, который можно запустить на любом новом разложении.
Выход: hydrate.py + тесты
Инфраструктура
2.4

Дашборд стадий и прогресса (HTML)

Интерактивный HTML-дашборд, показывающий: (а) прогресс экстракции — какие книги прочитаны, какие нет, сколько страниц обработано; (б) прогресс GP-разложений — сколько текстов разложено, сколько операций в базе, сколько типов в мета-алфавите; (в) стадия каждого текста — pipeline status (queued → decomposed → validated → merged); (г) здоровье мета-алфавита — распределение типов, покрытие доменов, кандидаты на мерж.
Выход: GP_PIPELINE_DASHBOARD.html
Визуализация Инфраструктура
2.5

Версионирование мета-алфавита

Мета-алфавит как JSON-файл в Git. Каждое добавление/мерж типа — коммит с обоснованием. Diff-визуализация: что изменилось между версиями. Changelog.
Выход: META_ALPHABET/ (git repo) + diff viewer
Инфраструктура
2.6

Загрузить данные пилота + контрольного прогона в базу

Первая загрузка: Stanford пилот (11 операций) + данные контрольного прогона (1.14–1.15). Проверить весь пайплайн end-to-end: JSON → валидация → граф → дашборд → визуализации.
Выход: Работающая система с первыми данными
Инфраструктура End-to-end тест

Gate 2: Инфраструктура готова

3
Первый эксперимент: сборка системы мышления
4–8 недель  |  20–30 текстов → proto-мета-алфавит + паттерны + GP-CoT
3.1

Отбор 20–30 текстов для GP-разложения

Stanford-корпус (12 статей) + ключевые фрагменты из экстрактов фазы 1 + 5–10 классических научных работ из разных доменов. Критерий: тексты с яркими примерами научного мышления.
Выход: CORPUS_v1/ (20-30 фрагментов)
Ручной отбор
3.2

Массовое GP-разложение скиллом + загрузка в базу

Прогнать 20–30 текстов через скилл (1.1). Каждый JSON → hydrate pipeline (2.3) → граф (2.2). На дашборде (2.4) видно прогресс в реальном времени.
Выход: 20-30 Decomposition в базе + обновлённый мета-алфавит
Скилл 1.1 Pipeline 2.3
3.3

Entity Resolution: сращивание алфавитов

Из 20–30 локальных алфавитов → proto-мета-алфавит. 3 уровня: структурный (авто), функциональный (полуавто), семантический (ручной). Прогноз: 25–40 типов.
Выход: META_ALPHABET_v0.1.json + ENTITY_RESOLUTION_LOG.md
Ручная + LLM
3.4

Pattern Detection: поиск повторяющихся цепочек

Автоматический поиск OperationPattern в графе. Какие цепочки типов повторяются? Какие паттерны доменно-специфичны, какие универсальны? Визуализация через 1.11.
Выход: PATTERNS_v0.1.md + визуализация в кросс-comparison viewer
Алгоритм Визуализация 1.11
3.5

«Карта операций научного мышления» (итоговая сборка)

Интерактивный HTML: мета-алфавит + генетическая карта + доменные сигнатуры + паттерны + drill-down до конкретных операций из конкретных текстов. Всё подключено к базе.
Выход: SCIENTIFIC_THINKING_MAP_v0.1.html
Визуализация
3.6

Первый эксперимент GP-CoT

Proto-мета-алфавит → структурированный chain-of-thought. Тест: дать LLM научную задачу, рассуждать через GP-операции. Сравнить с baseline (обычный CoT).
Выход: GP_COT_EXPERIMENT_REPORT.md
Эксперимент

Gate 3: Готовность к масштабированию

4
Масштабирование и продуктизация
3–6 месяцев  |  Циклы: 100 → 300 → 1000 текстов
4.1

Отбор 1000 сильнейших научных работ

Курация корпуса: ~15 доменов. Критерии: Нобелевские, Филдсовские, Тьюринговские, наиболее цитируемые + Kuhn-переломные.
Выход: CORPUS_1000/ + CORPUS_METADATA.json
Ручной + LLM-скаут Task #11
4.2

Массовое GP-разложение: 100 → 300 → 1000

Три итерации с ревизией мета-алфавита. При 100: стабилизация. При 300: доменные сигнатуры. При 1000: полный мета-алфавит. Entity Resolution на каждом цикле.
Выход: META_ALPHABET_v1.0.json
Скилл 1.1 (пакетный) Task #12
4.3

Масштабирование базы: Neo4j + Vector

~10 000–15 000 операций, ~100+ типов. Векторный индекс для семантического поиска. Версионирование через Git.
Выход: Neo4j DB + API (production)
Инфраструктура
4.4

GP-PRM: Process Reward Model

Мета-алфавит → reward function для оценки каждого шага рассуждения LLM.
Выход: GP-PRM model + benchmark
Цель 2
4.5

Dual-Plane Architecture (MAS)

Content Agent (содержание) + Form Agent (GP-структура) + Controller. Content Agent свободен, Form Agent — жёсткий GP-каркас.
Выход: MAS-прототип
Цель 2
4.6

Discovery Engine: генерация гипотез

Цепочки, возможные по генетической карте, но не наблюдавшиеся. Перенос паттернов между доменами. Генерация ограничена мета-алфавитом.
Выход: Automated Scientific Discovery System v0.1
Цель 1 Task #13
4.7

arXiv paper

Вариант A (быстрый): GP-CoT + Trace Analysis. Вариант B (глубокий): GP-PRM + Dual-Plane.
Выход: arXiv preprint
Task #14

Gate 4: Результат программы

Граф зависимостей

ФАЗА 1: ЭКСТРАКТ + ВИЗУАЛИЗАЦИЯ + ВАЛИДАЦИЯ 1.1 Скилл GP ────────────────────────────────────────────────────────────────────────────┐ 1.2 Скилл экстр. ─┬─ 1.3 Диссертация ─┐ │ ├─ 1.4 От логики ───┤ │ ├─ 1.5 Мифопсих. ───┼─ 1.7 Сборка тем ─── 1.12 Карта знаний HTML │ └─ 1.6 Сист.мышл. ─┘ │ │ 1.9 Дизайн визуализаций ─┬─ 1.10 Viewer единичного ─┐ │ └─ 1.11 Viewer кросс-текст.─┤ │ │ │ 1.13 Контр. корпус ─┬─ 1.14 Ручной прогон ──┐ │ │ └─ 1.15 Авто прогон ───┼─ 1.16 Сравнение ──── GATE 1 ──────────┐ │ │ │ │ ФАЗА 2: ИНФРАСТРУКТУРА │ │ │ │ │ │ 2.1 JSON-LD схема ──┬─ 2.2 Граф-БД ─────┬─ 2.3 Hydrate pipeline ──┐ │ │ │ └─ 2.4 Дашборд стадий ──┤ │ │ └─ 2.5 Версионирование ─────────────────┤ │ │ 2.6 Загрузка пилота ─┴── GATE 2 ──┤ │ │ │ ФАЗА 3: ЭКСПЕРИМЕНТ │ │ │ │ 3.1 Отбор 30 текстов ── 3.2 GP-разложение + hydrate ── 3.3 Entity Res. ──┤ │ │ │ │ 3.4 Паттерны ────────────┤ │ │ 3.5 Карта мышления HTML ─┤ │ │ 3.6 GP-CoT эксперимент ──┴ GATE 3 │ │ ФАЗА 4: МАСШТАБИРОВАНИЕ │ │ 4.1 Корпус 1000 ── 4.2 Масс. разложение ── 4.3 Neo4j prod ───────────────────┘ 4.4 GP-PRM ──┐ 4.5 MAS ─────┤ 4.6 Discovery4.7 arXiv ───┴── GATE 4

Риски и митигации

R1. Скилл GP-разложения теряет качество по сравнению с ручным прогоном

Автоматический скилл может пропускать операции, неверно классифицировать типы сопоставления, не замечать латентных эталонов.

Митигация: контрольный эксперимент (1.13–1.16) выявит расхождения до масштабирования. Итерация скилла до достижения <20% отклонений. Возможно, потребуются два режима: strict (ручной) и batch (автоматический).

R2. Entity Resolution не масштабируется

Сращивание алфавитов из 1000 текстов может потребовать экспертной работы, несоразмерной по объёму.

Митигация: автоматизировать структурный + функциональный уровни (80%); семантический — только для спорных случаев. Отладка на 30 текстах (фаза 3) до масштабирования.

R3. Таксономия S1-S6 недостаточна

6 типов сопоставления могут не покрыть все тексты.

Митигация: заложена процедура расширения (N1, N2...). Контрольный прогон (1.14) на текстах из 5 доменов рано покажет границы таксономии.

R4. GP-CoT/GP-PRM не даёт измеримого улучшения

Структурирование reasoning через GP-операции может не улучшить бенчмарки LLM.

Митигация: мета-алфавит имеет самостоятельную ценность. Discovery Engine (Цель 1) не зависит от Цели 2.

R5. Объём чтения материалов ГП

~15 книг, 300-500 страниц каждая.

Митигация: скилл тематического экстракта (1.2) автоматизирует. Приоритет: 4 ключевые книги, остальное — по остаточному принципу.

R6. Визуализации не передают суть

Граф операций или генетическая карта могут быть информативны технически, но непонятны для изучения и принятия решений.

Митигация: специальный шаг проектирования (1.9) до реализации. Итерация дизайна на данных пилота. Несколько типов представлений (граф, timeline, карточки, radar) — разные углы зрения на один объект.