Podczas konferencji dla klientów i partnerów Intel Vision 2024 , Intel zaprezentował akcelerator Gaudi 3, który zapewnia wydajność, otwartość i wybór dla generatywnej sztucznej inteligencji w przedsiębiorstwach (GenAI). Firma przedstawiła także pakiet nowych, otwartych skalowalnych systemów, produktów nowej generacji i strategicznej współpracy w celu przyspieszenia wdrażania GenAI. Ponieważ w ubiegłym roku tylko 10% przedsiębiorstw z powodzeniem wprowadziło projekty GenAI do produkcji, najnowsza oferta Intela stanowi odpowiedź na wyzwania stojące przed firmami w zakresie skalowania inicjatyw AI.
Dzięki krzemowi innowacje rozwijają się w bezprecedensowym tempie, ,a firmy szybko wdrażają rozwiązania korzystające ze sztucznej inteligencji. Intel wprowadza sztuczną inteligencję w całym przedsiębiorstwie, od komputerów, przez centra danych, po urządzenia brzegowe. Nasze najnowsze platformy Gaudi, Xeon i Core Ultra dostarczają spójny zestaw elastycznych rozwiązań dostosowanych do zmieniających się potrzeb naszych klientów i partnerów oraz wykorzystują ogromny potencjał. – powiedział Pat Gelsinger, dyrektor generalny Intela.
Przedsiębiorstwa chcą skalować GenAI od fazy pilotażowej do produkcyjnej. Aby to zrobić, potrzebują łatwo dostępnych rozwiązań opartych na wydajnych, ekonomicznych i energooszczędnych procesorach, takich jak akcelerator Intel Gaudi 3 AI, które rozwiązują również kwestie złożoności, fragmentacji, bezpieczeństwa danych i zgodności z przepisami.
Gaudi 3, czyli nowy akcelerator dla szkolenia i wnioskowania AI
Akcelerator Intel Gaudi 3 AI będzie zasilał systemy AI z dziesiątkami tysięcy akceleratorów, połączonych za pośrednictwem wspólnego standardu Ethernet. Intel Gaudi 3 gwarantuje 4x więcej obliczeń AI dla BF16 i 1,5-krotny wzrost przepustowości pamięci w porównaniu do swojego poprzednika. Akcelerator zapewni znaczący skok w szkoleniu i wnioskowaniu AI dla globalnych przedsiębiorstw, które chcą wdrożyć GenAI na dużą skalę.
W porównaniu do akceleratora Nvidia H100, Intel Gaudi 3 ma zapewnić średnio o 50% krótszy czas uczenia w modelach Llama2 z parametrami 7B i 13B oraz w modelu GPT-3 z parametrami 175B. Ponadto przewiduje się, że przepustowość wnioskowania akceleratora Intel Gaudi 3 przewyższy H100 średnio o 50%i 40% pod względem wydajności energetycznej wnioskowania, uśrednionej dla modeli Llama z parametrami 7B i 70B oraz Falcon z parametrami 180B.
Intel Gaudi 3 zapewnia otwarte, oparte na społeczności oprogramowanie oraz zgodny ze standardami branżowymi sieci Ethernet networking. Umożliwia on przedsiębiorstwom elastyczne skalowanie od pojedynczego węzła do klastrów, superklastrów i megaklastrów z tysiącami węzłów, wspierającymi wnioskowanie, dostrajanie i szkolenie w największej skali. Intel Gaudi 3 będzie dostępny dla producentów OEM – w tym Dell Technologies, HPE, Lenovo i Supermicro – w drugim kwartale 2024 roku.
Budowanie korzyści dla klientów dzięki rozwiązaniom Intel AI
Intel przedstawił swoją strategię dla otwartych, skalowalnych systemów sztucznej inteligencji, w tym sprzętu, oprogramowania, frameworków i narzędzi. Podejście Intela umożliwia oferowanie rozwiązań szerokiemu, otwartemu ekosystemowi użytkowników AI, które zaspokajają potrzeby GenAI dostosowane do potrzeb przedsiębiorstw. Obejmuje to producentów sprzętu, dostawców baz danych, integratorów systemów, dostawców oprogramowania i usług oraz innych. Umożliwia to również przedsiębiorstwom korzystanie z rozwiązań partnerów ekosystemu, których już znają i którym ufają.
Intel podzielił się swoją aktywnością z klientami korporacyjnymi i partnerami z różnych branż, aby wdrożyć rozwiązania akceleratora Intel Gaudi dla nowych i innowacyjnych aplikacji generatywnej sztucznej inteligencji.
• NAVER: Opracowanie potężnego modelu językowego (LLM) do wdrażania zaawansowanych usług AI na całym świecie, od chmury po urządzenia. NAVER potwierdził fundamentalne możliwości Intel Gaudi w zakresie wykonywania operacji obliczeniowych dla modeli transformatorów na dużą skalę z wyjątkową wydajnością energetyczą.
• Bosch: Zbadanie dalszych możliwości inteligentnej produkcji, w tym modeli podstawowych, generowanie syntetycznych zestawów danych anomalii produkcyjnych w celu zapewnienia solidnych, równomiernie rozłożonych zestawów szkoleniowych (np. zautomatyzowana inspekcja optyczna).
• IBM: Wykorzystanie procesorów Intel® Xeon® piątej generacji do przechowywania danych watsonx.data™ i ścisła współpraca z firmą Intel w celu walidacji platformy watsonx™ dla akceleratorów Intel Gaudi.
• Ola/Krutrim: Wstępne szkolenie i dostrajanie indyjskiego modelu bazowego z możliwościami generatywnymi w 10 językach, tworząc wiodące w branży rozwiązania w zakresie stosunku ceny do wydajności w porównaniu z rozwiązaniami rynkowymi. Krutrim obecnie wstępnie trenuje większy model bazowy na klastrze Intel® Gaudi®.
• NielsenIQ, spółka z portfolio Advent International: Zwiększenie możliwości Gen AI poprzez uczenie LLM specyficznych dla domeny w największej na świecie bazie danych gromadzącej zachowania zakupowych konsumentów, a także wzbogacenie oferty usług dla klientów przy jednoczesnym przestrzeganiu rygorystycznych standardów prywatności.
• Seekr: Lider w dziedzinie godnej zaufania sztucznej inteligencji uruchamia obciążenia produkcyjne na procesorach Intel Gaudi 2, Intel Data Center GPU Max Series i Intel Xeon w Intel® Tiber™ Developer Cloud w celu wsparcia rozwoju LLM i wdrożeń produkcyjnych.
• IFF: Globalny lider w dziedzinie żywności, napojów, aromatów i nauk biologicznych wykorzysta GenAI i bliźniaczą technologię cyfrową do stworzenia zintegrowanego przepływu pracy w biologii cyfrowej do zaawansowanego projektowania enzymów i optymalizacji procesów fermentacji.
• CtrlS Group: Współpraca przy budowie superkomputera AI dla klientów z Indii i skalowanie chmury CtrlS dla Indii za pomocą dodatkowych klastrów Gaudi.
• Bharti Airtel: Wykorzystując moc najnowocześniejszej technologii Intela, Airtel planuje wykorzystać swoje obszerne dane telekomunikacyjne w celu zwiększenia możliwości sztucznej inteligencji i poprawy doświadczeń swoich klientów. Wdrożenia będą zgodne z zobowiązaniem Airtel do pozostania w czołówce innowacji technologicznych i pomogą napędzać nowe źródła przychodów w szybko zmieniającym się cyfrowym środowisku.
• Landing AI: Precyzyjnie dostrojony, dostosowany do domeny LVM do wykorzystania w segmentacji komórek i wykrywaniu raka.
• Roboflow: Uruchamianie obciążeń produkcyjnych modeli YOLOv5, YOLOv8, CLIP, SAM i ViT dla kompleksowej platformy LVM.
• Infosys: Globalny lider w dziedzinie usług cyfrowych i konsultingowych nowej generacji ogłosił strategiczną współpracę w celu wprowadzenia technologii Intela, w tym procesorów Intel Xeon 4. i 5. generacji, akceleratorów Intel Gaudi 2 AI i komputerów AI PC do Infosys Topaz – pierwszego zestawu usług, rozwiązań i platform AI, które zwiększają wartość biznesową dzięki generatywnym technologiom AI.
Intel ogłosił również współpracę z Google Cloud, Thales i Cohesity w celu wykorzystania bezpiecznych możliwości obliczeniowych Intela w ich instancjach chmurowych. Obejmuje to Intel® Trust Domain Extensions (Intel® TDX), Intel® Software Guard Extensions (Intel® SGX) i usługę certyfikacji Intela. Klienci mogą uruchamiać swoje modele i algorytmy AI w zaufanym środowisku wykonawczym (TEE) i wykorzystywać usługi Intela do niezależnej weryfikacji wiarygodności środowisk TEE.
Ekosystem łączy siły w celu opracowania otwartej platformy dla sztucznej inteligencji w przedsiębiorstwach
We współpracy z Anyscale, Articul8, DataStax, Domino, Hugging Face, KX Systems, MariaDB, MinIO, Qdrant, RedHat, Redis, SAP, VMware, Yellowbrick i Zilliz, Intel ogłosił zamiar stworzenia otwartej platformy dla korporacyjnej sztucznej inteligencji. Celem tego ogólnobranżowego przedsięwzięcia jest opracowanie otwartych systemów GenAI tworzonego przez wielu dostawców, które zapewnią najlepszą w swojej klasie łatwość wdrażania, wydajność i wartość, dzięki generowaniu z rozszerzonym wyszukiwaniem.
RAG umożliwia rozszerzenie ogromnych, istniejących, zastrzeżonych źródeł danych przedsiębiorstw działających w standardowej infrastrukturze chmurowej o otwarte możliwości LLM, przyspieszając wykorzystanie GenAI w przedsiębiorstwach. W ramach wstępnych kroków Intel wyda referencyjne implementacje strumieni GenAI na bezpiecznych rozwiązaniach opartych o Intel Xeon i Gaudi, opublikuje techniczne ramy koncepcyjne i będzie nadal zwiększać pojemność infrastruktury w Intel® Tiber™ Developer Cloud w celu rozwoju ekosystemu i walidacji RAG i przyszłych potoków.
Intel zachęca do dalszego zaangażowania oraz łączenia sił w tworzeniu ekosystemu,, który ułatwi adaptację rozwiązań przez przedsiębiorstwa, poszerzy ich zasięg i przyspieszy osiąganie wyników biznesowych.
Rozszerzona strategia Intela w zakresie sztucznej inteligencji i podejście do otwartego ekosystemu
Oprócz akceleratora Intel Gaudi 3, Intel poinformował o aktualizacjach dotyczących swoich produktów i usług nowej generacji we wszystkich segmentach sztucznej inteligencji dla przedsiębiorstw.
Nowe procesory Intel® Xeon® 6: Procesory Intel Xeon oferują wydajne rozwiązania do uruchamiania obecnych rozwiązań GenAI, w tym RAG, które generują wyniki charakterystyczne dla biznesu przy użyciu zastrzeżonych danych. Intel wprowadził nową markę dla swoich procesorów najnowszej generacji dla centrów danych, chmury i brzegu sieci: Intel Xeon 6. Procesory Intel Xeon 6 z nowymi rdzeniami Efficient-cores (E-cores) zapewnią wyjątkową wydajność i zostaną wprowadzone na rynek w tym kwartale.
Intel Xeon 6 z rdzeniami Performance-cores (P-cores) zaoferują zwiększoną wydajność AI i zostaną wprowadzone na rynek wkrótce po procesorach z rdzeniami E.
• Procesory Intel Xeon 6 z rdzeniami E (poprzednia nazwa kodowa Sierra Forest):
◦ 2,4-krotny wzrost wydajności na wat4 i 2,7-krotny wzrost zagęszczenia5 w porównaniu z procesorami Intel® Xeon® 2. generacji.
◦ Klienci mogą wymienić starsze systemy w stosunku prawie 3 do 1, drastycznie obniżając zużycie energii i pomagając osiągnąć cele zrównoważonego rozwoju6.
• Procesory Intel Xeon 6 z rdzeniami P (wcześniej o nazwie kodowej Granite Rapids):
◦ Zintegrowana obsługa oprogramowania dla formatu danych MXFP4, który zmniejsza opóźnienie następnego tokena nawet 6,5-krotnie w porównaniu z procesorami Xeon 4. generacji wykorzystującymi FP16, z możliwością uruchamiania modeli Llama-2 o 70 miliardach parametrów.7
Klient, brzeg sieci i łączność: Intel ogłosił dynamiczny rozwój dla klientów i aktualizacje swojego planu działania w zakresie brzegu sieci i łączności, w tym:
• Procesory Intel® Core™ Ultra zapewniają nowe możliwości w zakresie produktywności, bezpieczeństwa i tworzenia treści, stanowiąc doskonałą motywację dla firm do odświeżenia swoich komputerów. Intel spodziewa się dostarczyć 40 milionów komputerów AI w 2024 roku, z ponad 230 segmentów od ultrasmukłych komputerów osobistych po przenośne konsole do gier.
• Rodzina procesorów konsumenckich Intel® Core™ Ultra kolejnej generacji (o nazwie kodowej Lunar Lake), która trafi na rynek w 2024 r., będzie obsługiwała ponad 100 platformowych teraoperacji na sekundę (TOPS) i ponad 45 jednostek przetwarzania neuronowego (NPU) TOPS dla komputerów AI nowej generacji.
• Intel ogłosił wprowadzenie nowych układów Edge Silicon z rodzin procesorów Intel® Core Ultra, Intel® Core™ i Intel® Atom oraz procesorów graficznych Intel® Arc™, skierowanych na kluczowe rynki, w tym handel detaliczny, produkcję przemysłową i opiekę zdrowotną. Wszystkie nowe dodatki do portfolio Intel Edge AI będą dostępne w tym kwartale i będą obsługiwane przez platformę Intel® Tiber™ Edge Platform w tym roku.
• Dzięki Ultra Ethernet Consortium (UEC), Intel jest liderem otwartej sieci Ethernet dla sieci AI, wprowadzając szereg rozwiązań Ethernet zoptymalizowanych pod kątem AI. Innowacje te, zaprojektowane z myślą o przekształceniu dużych, skalowalnych sieci AI, umożliwiają szkolenie i wnioskowanie dla coraz bardziej rozległych modeli, których rozmiary rosną z każdą generacją. Oferta obejmuje Intel AI NIC, chiplety łączności AI do integracji z procesorami XPU, systemy oparte na Gaudi oraz szereg miękkich i twardych referencyjnych projektów połączeń AI dla Intel Foundry.
Portfolio rozwiązań biznesowych Intel® Tiber
Intel zaprezentował portfolio rozwiązań biznesowych Intel® Tiber™ w celu ułatwienia wdrażania oprogramowania i usług dla przedsiębiorstw, w tym dla GenAI.
Ujednolicone środowisko ułatwia klientom korporacyjnym i programistom znajdowanie rozwiązań, które odpowiadają ich potrzebom, przyspieszają innowacje i odblokowują wartość bez narażania bezpieczeństwa, stabilności i wydajności. Klienci mogą zacząć poznawać portfolio Intel® Tiber™ już dziś, a pełne wdrożenie planowane jest na trzeci kwartał 2024 roku.
Zapowiedzi Intela na Vision 2024 podkreślają zaangażowanie firmy w uczynienie sztucznej inteligencji łatwo dostępną, otwartą i bezpieczną dla przedsiębiorstw na całym świecie. Dzięki nowym rozwiązaniom i współpracy, Intel jest w stanie przewodzić rewolucji AI, odblokowując niezrównaną wartość dla firm na całym świecie.
Prognozy dotyczące przyszłości
Niniejsza informacja zawiera prognozy dotyczące przyszłości, w tym dotyczące:
• naszych planów biznesowych i strategii oraz przewidywanych korzyści z nich wynikających;
• naszej strategii AI i akceleratorów AI;
• naszego podejście do otwartych platform i wsparcie ekosystemu w odniesieniu do sztucznej inteligencji; oraz inne informacje na temat przyszłych wydarzeń lub sytuacji.
Takie stwierdzenia wiążą się z wieloma zagrożeniami i niepewnością, które mogą spowodować, że nasze rzeczywiste wyniki będą znacznie różnić się od przedstawionych lub sugerowanych, w tym związanych z:
• wysokim poziomem konkurencji i szybkimi zmianami technologicznymi w naszej branży;
• znaczącymi długoterminowymi i z natury ryzykownymi inwestycjami, których podejmujemy się w zakresie badań i rozwoju oraz zakładów produkcyjnych, które mogą nie przynieść oczekiwanego zwrotu;
• złożonością i niepewnością związaną z opracowywaniem i wdrażaniem nowych produktów półprzewodnikowych i technologii procesów produkcyjnych;
• naszą zdolność do odpowiedniego planowania i skalowania naszych inwestycji kapitałowych oraz skutecznego zabezpieczania korzystnych alternatywnych rozwiązań finansowych i dotacji rządowych;
• wdrożeniem nowych strategii biznesowych i inwestowaniem w nowe firmy i technologie;
• zmianami w popycie na nasze produkty;
• warunkami makroekonomicznymi oraz napięciami i konfliktami geopolitycznymi, w tym napięciami geopolitycznymi i handlowymi między Stanami Zjednoczonymi a Chinami, skutkami wojny Rosji na Ukrainie, napięciami i konfliktami dotyczącymi Izraela oraz rosnącymi napięciami między Chinami kontynentalnymi a Tajwanem;
• rozwijającym się rynku produktów z funkcjami sztucznej inteligencji;
• naszymi złożonymi globalnymi łańcuchami dostaw, w tym zakłóceniami, opóźnieniami, napięciami i konfliktami handlowymi lub niedoborami;
• defektami produktów, poprawkami i innymi kwestiami związanymi z produktami, w szczególności w miarę opracowywania przez nas produktów nowej generacji i wdrażania technologii procesów produkcyjnych nowej generacji;
• potencjalnymi lukami w zabezpieczeniach naszych produktów;
• rosnącymi i zmieniającymi się zagrożeniami dla cyberbezpieczeństwa i prywatności;
• ryzykami związanymi z własnością intelektualną, w tym powiązanymi sporami sądowymi
i postępowaniami regulacyjnymi;
• koniecznością przyciągnięcia, zatrzymania i zmotywowania kluczowych talentów;
• strategicznymi transakcjami i inwestycjami;
• – zagrożeniami związanymi ze sprzedażą, w tym koncentracją klientów oraz korzystaniem z usług dystrybutorów i innych stron trzecich;
• Naszym znacznie obniżonym zwrotem z kapitału w ostatnich latach;
• naszymi zobowiązaniami dłużnymi i naszą zdolnością do uzyskania dostępu do źródeł kapitału;
• złożonymi i zmieniającymi się przepisami i regulacjami w wielu jurysdykcjach;
• wahaniami kursów wymiany walut;
• zmianami w naszej efektywnej stawce podatkowej;
• katastrofami;
• przepisami dotyczącymi środowiska, zdrowia, bezpieczeństwa i produktów;
• naszymi inicjatywami i nowymi wymogami prawnymi w odniesieniu do kwestii odpowiedzialności korporacyjnej; oraz innymi rodzajami ryzyka i niepewności opisanymi
w niniejszym komunikacie, naszym ostatnim raporcie rocznym na formularzu 10-K i innych naszych dokumentach złożonych w amerykańskiej Komisji Papierów Wartościowych i Giełd (SEC).