Согласно отчету IT House от 17 июля, команда Гонконгского университета науки и технологий разработала модель искусственного интеллекта для сегментации изображений под названием Semantic-SAM.По сравнению с моделью SAM, ранее выпущенной Meta, Semantic-SAM имеет более высокую степень детализации и семантические функции. может сегментировать и распознавать объекты на разных уровнях детализации, а также предоставлять семантические метки для сегментированных объектов. Сообщается, что Semantic-SAM разработан на основе фреймворка Mask DINO, и структура его модели в основном улучшена в части декодера, поддерживая при этом общую сегментацию и интерактивную сегментацию. Исследовательская группа реализовала оптимизацию задач многогранной сегментации и интерактивных задач сегментации, приняв методы разделения объектов и классификации частей для изучения семантической информации об объектах и частях. Экспериментальные результаты показывают, что Semantic-SAM превосходит модель Meta SAM с точки зрения качества сегментации и управляемости детализации.