Управление Инцидентами В Itsm С Использованием Искусственного Интеллекта Тема Научной Статьи По Компьютерным И Информационным Наукам Читайте Бесплатно Текст Научно-исследовательской Работы В Электронной Библиотеке Киберленинка
Что достигается изучением качества результатов деятельности по устранению основных проблем и инцидентов. Нельзя пренебрегать регулярным (не менее двух раз в год) обучением сотрудников на всех уровнях, включая стратегический. Необходимо довести навыки управления до автоматизма, например обязательно четко и по процедуре совершать заранее определенные действия в первые часы инцидента. Все разработанные документы и процессы помогут принять взвешенные решения и не допустить критических последствий для бизнеса.
Временные рамки и ответственность в рамках эскалации сильно отличаются в зависимости от организации, промышленности и уровня сложности проблем. В передовых организациях проводятся переговоры с конечными пользователями для определения подходящих временных рамок и эскалации ответственности. Результат таких переговоров реализуются в виде соглашений об уровне сервиса, автоматизированных средств, списков, шаблонов.
Например, если вы выбрали “Доступность” как тип SEVа в DropSEV, он выведет таблицу вроде этой, чтобы помочь вам сопоставить степень глобального влияния на доступность с уровнями SEV. Когда в Dropbox дело доходит до обнаружения проблем, наши системы мониторинга являются ключевым компонентом. За годы работы мы построили и усовершенствовали несколько систем, на которые инженеры полагаются во время инцидента. Первая и самая важная — это Vortex, система метрик и оповещений на стороне сервера. Vortex гарантирует, что задержка при получении данных будет измеряться в секундах, частоту дискретизации 10 секунд и простой интерфейс для создания персональных уведомлений для конкретных сервисов. Чтобы минимизировать вред для бизнеса, при работе с инцидентами специалисты поддержки фокусируются на максимально быстром восстановлении сервиса.
Наши команды получают множество уведомлений в PagerDuty о состоянии сервисов, однако не каждое из них “достойно SEVа”. Раньше это означало, что первый респондент, получивший оповещение об инциденте, должен был побеспокоиться не только о самом происшествии, но и о том, достойно ли оно заполнения SEVа и запуска формального процесса управления инцидентами. Мы в Dropbox считаем, что управление инцидентами — это центральный элемент нашей системы по обеспечению надёжности.
Кроме того, обращение может поступить через внешний портал, в таком случае клиент сам заводит карточку обращения, а далее саппорт работает с ней. Что такое управление инцидентами по ITIL и зачем компаниям автоматизировать этот процесс. В чем отличия первой и второй линии поддержки, и какие инструменты автоматизации сервиса помогают им в работе.
С помощью машинного обучения с течением времени происходит изменение контекста под потребности определенного пользователя, что позволяет уменьшить время для пользователя на нахождение интересующей информации или ответа на вопрос. Каждая из подобных процедур, проводимая с определенной регулярностью, поможет понимать текущий уровень эффективности системы защиты и не допускать возникновения инцидентов ИБ. Все это подтверждает важность управления инцидентами ИБ в любой организации.
Процессы Управления Инцидентами Itil
Запросы на обслуживание не несут серьезной угрозы бизнесу, поэтому такие обращения обладают меньшей срочностью, чем инциденты. Приоритет и срочность у подобных обращений всегда ниже, чем у инцидентов, в силу меньшей критичности для бизнеса. Однако это не значит, что выполнение запросов на обслуживание можно затягивать.

В таблице four иерархическая эскалация происходит на третьем шаге эскалации для проблем всех уровней важности. Управление проблемами — есть деятельность по минимизации воздействия на бизнес проблем, которые вызываются ошибками в ИТ-инфраструктуре, по предотвращению повторения инцидентов, связанных с такими ошибками. Управление проблемами выявляет причины проблем, идентифицирует решения по их обходу или устранению. Для этого определяются затронутые ресурсы и принимаются меры по ограничению дальнейшего распространения инцидента. Например, при заражении вредоносным программным обеспечением осуществляется ограничение доступности зараженных устройств. Дополнительно осуществляется уведомление пользователей, использующих затронутые ресурсы, о проводимых работах.
Обычные сотрудники отвечают за уведомление и выполнение поручений ответственных, а те, в свою очередь, — за мониторинг и обработку инцидентов ИБ. Ответственными назначаются специалисты по информационной безопасности, IT-специалисты, а в некоторых случаях — сотрудники специализированных подразделений. Без должного управления такие события могут угрожать жизням людей, их безопасности, здоровью, собственности или окружающей среде. Примерами инцидентов могут служить Как подобрать инструмент для управления инцидентами отступления от лучших практик, незначительные проблемы с качеством продукции, оповещения о природных катаклизмах, пожары, обнаружение подозрительных предметов. Следовательно, чем сильнее система управления инцидентами и кризисными ситуациями будет соответствовать специфике конкретного бизнеса, тем более эффективно и оперативно будут решены поставленные задачи. Мы приняли трудное решение проверять на соответствие строго всех, без каких-либо исключений.
На каждой производственной площадке необходимо сформировать команду по управлению инцидентами, ее возглавит директор производства, а в команду войдут представители основных функциональных направлений. После каждого определения можно сразу описать уровни управления этими событиями, каналы коммуникаций, также собрать эти данные в сводную таблицу. Пример того, как можно преподать такую информацию в кратком формате, удобном для понимания участниками процесса, приведен в таблице.
“Насколько болезненен этот SEV для наших клиентов?” Ответ на этот вопрос не ускорит восстановление, но позволит нам проактивно коммуницировать с пользователями и Быть Достойными Доверия, что является главной ценностью нашей компании. Во время перебоя в доступности или другого критического инцидента в процесс вовлекаются многие другие участники проекта, помимо SEV-команды, работающей над устранением проблемы. Один из наиболее эффективных инструментов диагностики в Dropbox — инфраструктура отслеживания исключений. Она позволяет любому сервису в Dropbox отправлять стектрейсы в центральное хранилище вместе с полезными метаданными. Интерфейс позволяет разработчикам с лёгкостью видеть и изучать тенденции исключений в их сервисах.
Заключение: Управление Инцидентами Иб Защитит От Утечек Данных И Других Рисков
Сервисные сотрудники вовремя узнают о появлении новых обращений и оперативнее приступят к их выполнению. На сегодняшний день для оптимизации процессов управления инцидентами в ITSM уже существуют и используются следующие инструменты ИИ [7]. При управлении инцидентами ИБ важно определить единый подход для организации, описывающий кто, что и как должен делать в случае наступления инцидента ИБ. Он может быть представлен в виде формализованного регламента и, например, более простого и доступного порядка действий или инструкции, опубликованной на каком-либо внутреннем ресурсе. Очень важно разделять такие понятия, как публичный отзыв, изъятие с рынка, а также возврат со склада. Четкое определение каждого события позволит оперативно выбрать верные корректирующие действия (по аналогии с инцидентами и кризисными ситуациями).
Мы также отслеживаем влияние сервисов на критическом пути с помощью распределённой трассировки. Инфраструктура трассировки используется для вычисления веса каждого сервиса. Этот вес является приблизительным показателем того, насколько важен сервис как часть Dropbox в целом.
- В этом посте мы расскажем подробно о нескольких уроках, которые Dropbox вынесли из опыта управления инцидентами.
- Она основана на передовом опыте и используется как руководство ИТ-организациями при разработке подходов к управлению обслуживанием.
- Как результат — база решений, которая доступна для разрешения повторных инцидентов.
- После того, как эскалация произошла, ожидается, что соответствующий менеджер активно управляет решением проблем и становится единым контактом для сообщений о статусе.
Преимущества наличия такой общей платформы — вы можете легко добавлять новые метрики с течением времени. Отлично — можно добавить панель на общий дэшборд, на которой будут отображаться эти данные. Мы также вложили средства в добавление аннотаций в Grafana, которые сопоставляют основные события (пуш кода, DRT, и тд) с метриками, чтобы помочь инженерам с корреляцией. Каждое из таких дополнений немного сокращает время диагностики в компании. Поэтому этим летом мы начали автоматически регистрировать все SEVы, связанные с доступностью. Владелец сервиса по-прежнему получает свои системные оповещения, однако DropSEV обнаружит влияние на доступность, достойное SEVа, и автоматически запустит процесс реагирования на инцидент.
В результате во время последующих инцидентов, влияющих на вебсайт, мы быстро определяли, затронуты ли ключевые рабочие процессы пользователей, и использовали эту информацию для взаимодействия с клиентами. Как правило, в структуре менеджмента супервизоры и операторы ServiceDesk выявляют инциденты и создают решения для их устранения. Эффективное управление инцидентами позволяет сократить число обращений и снизить их влияние на обслуживание, обеспечивая информационную безопасность.
Чат-бот: Функционал, Преимущества И Применение В Работе
Более быстрое обнаружение и разрешениеОсновное преимущество автоматизации – это скорость. Она обнаруживает и разрешает инциденты гораздо быстрее, чем при ручном управлении. Поскольку при автоматизации исключается вмешательство человека, вы можете эффективно сократить среднее время обнаружения (MTTD) и среднее время разрешения (MTTR). Поэтому тщательное планирование того, каким образом ответственность будет функционально передана на третий уровень, критически важно.

Тем не менее, сроки и условия работы с подобными типами обращений должны четко регламентироваться в соглашении SLA. Сделать процесс работы с инцидентами и запросами на обслуживание эффективным помогают инструменты автоматизации, например, сервис деск. Общепринятое определение звучит как «запрос пользователя на информацию, консультацию, стандартное изменение или доступ к ИТ-услуге». В отличие от инцидентов в этом случае нет опасности для бизнес-процессов и ничего не угрожает бесперебойному предоставлению сервисов. Проблемы, которые не исследуются, продолжают отслеживаться для исследования их в будущем.
Искусственный интеллект сам отберет ключевые моменты и структурирует заявку, опишет возникшую у пользователя проблему или сформулирует вопрос. Если пользователь выбрал диалог с чат-ботом, то решение может найтись уже на этом уровне и займет минимальное количество времени. Иначе виртуальный интеллектуальный диспетчер регистрирует и структурирует заявку, присваивает ей определенную категорию и передает специалисту, который способен справиться с решением по данной заявке. Сотрудник первой линии получает заявку от ИИ-диспетчера, при этом аналитическая машина может подсказывать ему возможные решения проблемы, и он оперативно помогает пользователю [4]. В случаях, когда решение не удается найти на первой линии поддержки, происходит эскалация запроса на более высокий уровень поддержки, где аналитическая система также помогает сотрудникам ИТ-подразделения в решении инцидентов.
Пару раз SEVы просто не регистрировались, то есть мы упустили возможность привлечь IMOC и BMOC, пока техническая группа работала над восстановлением доступности. Сокращение времениПоскольку весь процесс улучшается и ускоряется, экономится огромное количество времени. Реагирование на инцидент осуществляется мгновенно, и в процессе не возникает никаких задержек. Эти основные процессы присутствуют практически во всех передовых организациях, хотя могут иметь и другие названия. Инцидент — есть любое событие, которое не является частью стандартных операций сервиса и вызывает, или может вызвать, прерывание обслуживания или снижение качества сервиса. И уже через пару минут сможете арендовать сервер, развернуть базы данных или обеспечить быструю доставку контента.

Такой план может представлять собой модель, предназначенную для адаптации и внедрения в каждом региональном представительстве или производственной площадке. На основании этой политики могут разрабатываться собственные стандарты управления инцидентами и кризисными ситуациями в региональных представительствах, а также создаваться команды по управлению кризисами и инцидентами. Также как мы не виним отдельных людей за SEVы, никто не может взять на себя единственную ответственность по улучшениям, которые мы внесли в управление инцидентами. Но хочется выделить и поблагодарить некоторых из них — нынешних и бывших сотрудников команд структур надёжности, телеметрии, метаданных, прикладных сервисов и экспериментов — за темы, затронутые в этой статье. Мы начали с SEV процессов, которые работали отлично в тот момент, но с ростом компании, систем и количества пользователей нам приходится постоянно развиваться. Уроки, которые мы описали в этом посте дались нам не просто так; часто приходилось пережить SEV или два, чтобы понять, где не хватало нашей реакции на инциденты.
То есть с помощью ServiceDesk операторы могут обрабатывать обращения, которые поступают из ChatDesk, от внешних пользователей через внешний портал или которые создают сами операторы ServiceDesk. Кроме этого, для внешних коммуникаций в ChatDesk легко подключить самые распространённые мессенджеры, а также настроить интеграцию с электронной почтой. Эффективность операторов и показатели качества их работы контролируют супервизоры ServiceDesk. Система автоматически автоматизирует, распределяет и типизирует обращения. В случае ручной маршрутизации супервизоры назначают операторов для работы с новыми обращениями и перераспределяет запросы с учетом загрузки и статусов работы.
Leave a Comment