Сервис анонимизации медицинских документов

Убираем персональные данные
из результатов анализов

PROMASK распознаёт документ, находит в нём ФИО, даты рождения, контакты и реквизиты и закрывает их. Остаётся только медицинское содержание, которое можно спокойно передавать дальше.

Документ Распознавание текста Правила + машинное обучение Маскированный результат
Загрузить документ →
7
категорий персональных данных находим в документе
3
формата результата: текст, изображение, PDF
0
копий документа храним: всё живёт в памяти запроса
01 · проблема

Результаты анализов содержат персональные данные

В бланке лаборатории всегда есть ФИО пациента и дата рождения, иногда адрес и телефон. Это персональные данные, поэтому передать такой документ во внешнюю систему расшифровки или сравнения цен нельзя. А зачищать вручную долго и ненадёжно: человек устаёт и пропускает, да и формат у каждой лаборатории свой.

02 · как это работает

Обработка за 4 шага

01 OCR

Распознавание

PDF или фото проходит OCR. Возвращается текст и координаты каждого слова на странице.

02 собственные наработки

Скриптовая обработка

Собственные правила ловят жёсткие форматы: СНИЛС, полис ОМС, телефоны, даты, ИНН.

03 дообучено

Машинное обучение

Модель, дообученная на медицинских текстах, находит ФИО, организации и реквизиты в любой вёрстке.

04 3 формата

Маскирование

Найденное закрывается: в тексте ставятся метки, на изображении и в PDF рисуются чёрные прямоугольники.

03 · чем отличается

Сравнение способов убрать ПДн

ВручнуюПростые регуляркиPROMASK
ФИО пациента и врача глаз пропускаетимена не ловятся правила + ML-модель
Разные лаборатории каждый формат зановоломаются на новой вёрстке модель обобщает
Скорость на документ минуты ручной работыбыстро секунды
Формат результата по-разномутолько текст текст, изображение, PDF
04 · что возвращает сервис

Три формата результата

Маскированный текст

Чистый текст документа, где ФИО и реквизиты заменены метками вида [PERSON], [DATE]. Готов для передачи в расшифровщик.

Изображение

Исходное фото или скан с чёрными прямоугольниками поверх персональных данных.

PDF

Многостраничный PDF с замаскированными данными на каждой странице. Визуально как оригинал, только без персональных данных.

Что находим: ФИО пациента и врача, даты рождения, телефоны, email, адреса, названия и реквизиты организаций, номера заявок.
Откуда: PDF с текстовым слоем, сканы и фотографии бланков разных лабораторий и медицинских центров.
Как: связка детерминированных правил и модели машинного обучения. Правила дают точность на жёстких форматах, а модель обобщает на новую вёрстку.
05 · попробовать

Загрузите документ

Демо-режим. Загрузите PDF или изображение результата анализа и выберите формат результата.

Проверяем доступный лимит…
Распознаём документ…
Документы не сохраняются, всё обрабатывается в памяти запроса.
06 · лабораториям и клиникам

Поделитесь обезличенными бланками

Чем больше разных форматов видит модель, тем точнее она работает. Если ваша лаборатория или медицинский центр готовы прислать примеры бланков, это заметно улучшит качество анонимизации и для вашего формата, и для чужих.

Что нужно: примеры бланков результатов. Данные пациента можно заранее заменить на вымышленные или вообще убрать.
Что вы получаете: сервис, который корректно обезличивает именно ваш формат документов.
Статус: проект в разработке. Это пока не коммерческий релиз, а пилот: собираем форматы и обкатываем сервис.
emailinfo@pro-labs.ru
телефон+7 (495) 132-60-37
время ответав течение 24 часов
07 · хотите внедрить у себя

Использовать PROMASK в своём продукте

Продукт только набирает обороты. Позади первый полноценный эксперимент на реальных документах. Если хотите применять анонимизацию у себя на коммерческой основе, оставьте заявку, и мы обсудим условия и интеграцию.

Лаборатория
Лабораторная сеть
Медицинский центр
Другое
Укажите хотя бы одно: телефон или email.