О проблеме
Потери, вызванные простоями ИТ-услуг, болезненны для каждой компании. В авральной борьбе за доступность услуги специалисты могут не иметь времени и ресурсов на решения, которые избавили компанию от инцидентов раз и навсегда. Обходные решения, применяемые специалистами, купируют симптомы сбоя и восстанавливают доступность, но не устраняют корневую причины аварий.
Если компания стремится избежать повторения катастроф, она выстраивает внутренние процессы по выявлению причин инцидентов и по их разрешению, сталкиваясь при этом с вызовами:
Отсутствует внешняя мотивация
Инцидент устранен, услуги доступны, заказчик и пользователи уже не висят дамокловым мечом над специалистами, которым и так есть чем заняться
Анализ и диагностика – это дорого
Заниматься вдумчивой и размеренной работой по анализу, выявлению и устранению накопленного технического долга – дорого: требуются специалисты высокой квалификации с высокой текущей нагрузкой. Трудно выделить их время еще и на это
Все «тушат пожары»
Специалистов много, но они тотально заняты или непродуктивным трудом по устранению инцидентов, или проведением изменений, которые эти инциденты и порождают
Проблемы всегда на границе ответственности
Причины возникновения инцидентов очень редко быстро и легко идентифицируются. Особенные трудности возникают, когда совместным анализом должны заниматься несколько подразделений вместе. Подобные расследования не обходятся без поиска виновных
Регулярное изобретение велосипедов
Информация по расследованным проблемам или не протоколируется и не накапливается, или не используется первой линией, сотрудниками, устраняющими инциденты. Найденные ранее обходные решения изобретаются заново. Результаты расследований, которые удается проводить, складываются «в стол»
Трудно доказать прогресс и результативность процесса
Результативность процесса сильно зависит от подхода к регистрации проблем, который в ряде случаев может носить исследовательский характер с непредсказуемым заранее результатом о полноте. Число зарегистрированных проблем не получается сделать числовым KPI. Трудно доказать прямую связь между результативностью процесса и текущей картиной по выявляемым инцидентам
Нехватка умений диагностировать проблемы
Исследовательская и диагностическая работа требует предрасположенности к другому складу мышления, обширных предметных компетенций, способности к анализу и исследовательской работе, навыков soft skills по координации R&D инициатив. Не во всех ИТ-подразделениях есть люди с такими умениями
Отсутствие поддержки аналитиков проблем
Аналитики проблем автоматически назначаются ответственными за их решение/координацию, в нагрузку к текущим обязанностям. Коллеги не поддерживают инициативы аналитиков по выявлению и регистрации проблем, т.к. работа с проблемой становятся дополнительной, часто сверхурочной нагрузкой
Способности Cleverics
Выстраивать совместную исследовательскую работу множества групп и организаций.
Обучать аналитиков проблем подходам к анализу проблем
Обучать аналитиков проблем подходам к анализу проблем
Обеспечивать контроль использования знаний об известных проблемах и обходных решениях
Применять инструменты машинного обучения для выявления однотипных инцидентов
Формировать внутренние стимулы для поддержания деятельности процесса
Бизнес-результат
Снизить потери бизнеса за счет предотвращения повторных инцидентов и применения готовых обходных решений
Снизить затраты ИТ-функции на непродуктивный труд по борьбе с проявлениями накопленного технического долга
Совместная работа и расследование
Сформировать и поддерживать ресурсами исследовательскую практику в который участвую специалисты множества центров компетенций – большой вызов. Наша задача, в роли консультантов, помочь компании организовать эту кроссфункциональную работу, поддержать инициативы аналитиков проблем, заручиться поддержкой руководства, показав важность этой общей работы
Повторное использование знаний
Инструменты решений Cleverics помогают сделать информацию об известных ошибках в ИТ-инфраструктуре и приложениях, обходных решениях доступной людям, которые остро в ней нуждаются. Инструменты поиска, интеллектуальных подсказок, информирования позволяют решать эту задачу. В отдельных, идеальных, случаях, применение обходного решения может быть полностью автоматизировано
Применение инструментов машинного обучения в помощь аналитику проблем
Алгоритмы машинного обучения могут использоваться для анализа потока регистрируемых инцидентов, выявления похожих инцидентов, поиска корреляции инцидентов с событиями с системных логов, информацией о статусе конфигурационных единиц, журналом проводимых регламентных работ и изменений
Внутренние стимулы
Один из столпов успеха применения процесса управлению проблемами в проектах с нашим участием – заинтересованность руководства. Руководство ИТ-функции является первичным управленческим звеном, напрямую заинтересованным в снижении накопленного технического долга, в противном случае, борьба с разрастающимся хаосом сбоев поглотит все имеющиеся ресурсы. Мы всегда выступаем за максимальную публичность успехов работы процесса, доступность всех его артефактов, поощрение вовлеченных в процесс специалистов
Резюме
Экспертиза Cleverics в области организации операционных ИТ-процессов, а также продуктовые инструментальные решения позволят решить задачи по снижению общих затрат организации и внутренних потерь ИТ-функции, связанных с сокращением технического долга и предотвращением возникновения инцидентов:
Уменьшается частота возникновения простоев
Если причины инцидентов будут своевременно расследоваться и устраняться, то возникновение повторных инцидентов будет минимизировано
Уменьшается длительность интервалов простоя
Если корневая причина известна, но еще не устранена, то компания будет иметь наготове обходные решения для повторных инцидентов, которые или предотвратят их проявление, или принципиально снизят длительность их разрешения
Повышение доли продуктивного труда
Снижение уровня накопленного технического долга позволит ИТ-функции занять ИТ-специалистов, занятых ранее устранением потоков инцидентов, более полезным для компании трудом