Salesforce Wprowadza Pierwszy na Świecie Benchmark Dużych Modeli Językowych AI

W erze cyfryzacji, gdzie technologia odgrywa kluczową rolę w zarządzaniu relacjami z klientami (CRM), Salesforce wprowadził przełomowe narzędzie – pierwszy na świecie benchmark dużych modeli językowych (LLM). Benchmark ten został stworzony, aby pomóc firmom ocenić rosnącą liczbę LLM i wybrać najlepsze rozwiązania do swoich systemów CRM.

Czym Jest Benchmark Salesforce?

Nowy benchmark Salesforce to kompleksowe ramy oceny, które mierzą wydajność LLM w czterech kluczowych obszarach: dokładności, kosztów, szybkości oraz zaufania i bezpieczeństwa. Zaprojektowany specjalnie do oceny typowych przypadków użycia w sprzedaży i usługach, takich jak prospecting, lead nurturing, podsumowania szans sprzedaży i przypadków usług, benchmark ten jest niezastąpionym narzędziem dla firm chcących wdrożyć generatywną sztuczną inteligencję do swoich systemów CRM.

Kluczowe Metryki Benchmarku

Dokładność

Dokładność oceniana jest na podstawie czterech podkategorii: rzeczowości, kompletności, zwięzłości i zgodności z instrukcjami. Precyzyjne przewidywania i zalecenia są niezbędne do poprawy jakości obsługi klienta oraz efektywności działań zespołów sprzedaży i usług. Nawet jeśli model nie jest wystarczająco dokładny, techniki takie jak szybka inżynieria i dostrajanie mogą go poprawić.

Koszt

Koszt operacyjny modeli LLM jest oceniany jako wysoki, średni lub niski, w zależności od percentyli. Ta metryka pozwala firmom na ocenę opłacalności różnych rozwiązań i dostosowanie wyboru modelu do swojego budżetu oraz strategii alokacji zasobów.

Szybkość

Szybkość reakcji i wydajność LLM w przetwarzaniu informacji to kluczowy wskaźnik. Krótszy czas reakcji poprawia doświadczenie użytkownika, skracając czas oczekiwania klientów i umożliwiając szybkie reagowanie na zapytania oraz problemy.

Zaufanie i Bezpieczeństwo

Bezpieczeństwo danych klientów, zgodność z przepisami dotyczącymi prywatności danych, ochrona informacji oraz unikanie stronniczości i toksyczności to kluczowe aspekty zaufania i bezpieczeństwa. Ocena tych parametrów daje firmom pewność, że wybrane LLM są niezawodne i bezpieczne.

Znaczenie Benchmarku dla Biznesu

Dotychczasowe benchmarki LLM były skoncentrowane na zastosowaniach akademickich i konsumenckich, co ograniczało ich użyteczność w kontekście biznesowym. Brakowało im odpowiednich ocen ekspertów oraz uwzględnienia kluczowych metryk takich jak dokładność, szybkość, koszty i zaufanie. Salesforce, opracowując swój benchmark, wypełnił tę lukę, oferując firmom narzędzie do strategicznej oceny i wyboru odpowiednich modeli AI.

Wykorzystanie Benchmarku przez Salesforce AI Research

Benchmark Salesforce wykorzystuje rzeczywiste dane CRM oraz eksperckie oceny praktyków, co umożliwia firmom podejmowanie bardziej świadomych decyzji dotyczących wdrożenia generatywnej sztucznej inteligencji. Platforma Einstein 1 firmy Salesforce pozwala klientom wybierać spośród istniejących rozwiązań LLM lub tworzyć własne modele spełniające unikalne potrzeby biznesowe.

Przyszłość Benchmarku

Salesforce planuje dalsze rozwijanie benchmarku, dodając nowe scenariusze przypadków użycia oraz ulepszając ocenę LLM. Celem jest zapewnienie firmom narzędzia, które będzie dynamicznie ewoluować, dostosowując się do zmieniających się potrzeb rynku.

Podsumowanie

Wprowadzenie przez Salesforce pierwszego na świecie benchmarku dużych modeli językowych AI to krok milowy w dziedzinie CRM. Dzięki niemu firmy mogą efektywniej oceniać i wdrażać rozwiązania AI, poprawiając swoje procesy sprzedaży i obsługi klienta. Benchmark ten, oparty na rzeczywistych danych i ekspertowych ocenach, oferuje niezastąpione narzędzie do strategicznego zarządzania technologią w biznesie.

Jak podkreśliła Clara Shih, dyrektor generalna Salesforce AI, „Ten benchmark to nie tylko miara; to kompleksowa, dynamicznie ewoluująca struktura, która umożliwia firmom podejmowanie świadomych decyzji, równoważąc dokładność, koszty, szybkość i zaufanie.” Dzięki temu narzędziu, organizacje mogą skuteczniej wykorzystywać sztuczną inteligencję do napędzania wzrostu, obniżania kosztów i dostarczania spersonalizowanych doświadczeń klientów, co jest kluczowe w dzisiejszym konkurencyjnym środowisku biznesowym.