Logo
Версия для печати

Google вывела фреймворк LiteRT в релиз

Google Google

Google официально отправила LiteRT (тот самый TensorFlow Lite) в стабильный продакшн.

 

Разработчики наконец-то получили нормальный, унифицированный доступ к NPU от Qualcomm и MediaTek. Плюс ко всему, новый движок ML Drift на GPU обгоняет классический TFLite в среднем в 1,5 раза.

Результаты бенчмарков на Samsung S25 Ultra выглядят почти нереально: на Gemma 3 LiteRT умудрился обойти llama.cpp в 3 раза на процессоре и в 19 раз на GPU (в prefill).

Если вы раньше страдали при переносе моделей, хорошая новость: теперь есть прямая конвертация из PyTorch и JAX. При этом старые наработки не сломали: формат .tflite поддерживается, но Google рекомендует использовать новый API CompiledModel.

2013 - 2026 © 24minsk.by. Все права защищены.
Использование любых материалов, размещённых на интернет-сайте, разрешается при условии ссылки (для интернет-ресурсов - активной гиперссылки) на 24minsk.by.