Bielik to polska odpowiedź na amerykański ChatGPT. Tworzyli go pasjonaci z Kluczborka

Milena Zatylna
Gdy cały świat zachwyca się ChatemGPT, my, Polacy, powinniśmy być dumni, że mamy Bielika, czyli polski model językowy. Chociaż na pewno pod wieloma względami – przynajmniej na razie – ustępuje amerykańskiemu „kuzynowi”, to w niektórych aspektach jest od niego lepszy. I co ciekawe, oba narzędzia mają kluczborskie korzenie.
Gdy cały świat zachwyca się ChatemGPT, my, Polacy, powinniśmy być dumni, że mamy Bielika, czyli polski model językowy. Chociaż na pewno pod wieloma względami – przynajmniej na razie – ustępuje amerykańskiemu „kuzynowi”, to w niektórych aspektach jest od niego lepszy. I co ciekawe, oba narzędzia mają kluczborskie korzenie. Gerd Altmann/Pixabay
Gdy cały świat zachwyca się ChatemGPT, my, Polacy, powinniśmy być dumni, że mamy Bielika, czyli polski model językowy. Chociaż na pewno pod wieloma względami – przynajmniej na razie – ustępuje amerykańskiemu „kuzynowi”, to w niektórych aspektach jest od niego lepszy. I co ciekawe, oba narzędzia mają kluczborskie korzenie.

Bez wielkich pieniędzy, rządowych grantów i pomocy od korporacji

Bielik to otwarty model językowy, tworzony przez społeczność SpeakLeash (Spichlerz), którego pomysłodawcą jest pochodzący z Kluczborka Sebastian Kondracki, ekspert ds. transformacji cyfrowej z naciskiem na innowacje i sztuczną inteligencję (AI), Chief Innovation Officer w firmie Deviniti, autor książki „Python i AI dla e-commerce”.

- Kiedy ukazał się europejski model językowy Bloom opracowany przez Francuzów, jeden z podkasterów zapytał, czy mógłbym zrobić coś, żeby narzędzie to zaczęło mówić po polsku – wspomina Sebastian Kondracki. - I to był pierwszy impuls, żeby działać.

Prace nad Bielikiem rozpoczęły się w 2022 roku. Trzon jego założycieli to osoby związane z Kluczborkiem.

- Wciągnąłem w pierwszej kolejności moich znajomych, współpracowników biznesowych, stąd wątek lokalny. Można powiedzieć, że za ChatemGPT stoi Wojtek Zaremba, a my za Bielikiem, czyli kluczborczanie mają duży wkład w rozwój sztucznej inteligencji – tłumaczy Sebastian Kondracki. - Zaczęliśmy tworzyć nasz model oddolnie, wzorując się na Linuksie, najsłynniejszym systemie operacyjnym na świecie, który powstał w oparciu o środowiska opensource, czyli otwartego programowania. Wiedzieliśmy, że jest to możliwe.

Teraz Bielik skupia ponad 3 tysiące osób.

- W trakcie dołączyło do nas Akademickie Centrum Cyfrowe Cyfronet Akademii Górniczo-Hutniczej w Krakowie. Dzięki temu mogliśmy korzystać z zasobów obliczeniowych dwóch największych polskich superkomputerów, Heliosa i Atheny, i już na poważnie trenować - relacjonuje Sebastian Kondracki. – Współpracujemy też z Ministerstwem Cyfryzacji.

Za twórcami polskiego chatu nie stoją wielkie pieniądze, rządowe granty czy obracające milionami korporacje. Pracują w czasie wolnym, za darmo, całkowicie hobbistycznie. Ale z wielkim oddaniem.

Bielik wylądował

Potwierdzeniem tego jest fakt, iż w ciągu zaledwie dwóch lat udało im się stworzyć produkt, z którego każdy chętny może korzystać. I to w dodatku bezpłatnie. To Bielik 2.0, który we wrześniu ubiegłego roku miał swój start.

- W trakcie tworzenia polskiego chatu przyświecało nam kilka celów. Po pierwsze zagraniczne narzędzia, w tym modele GPT, są dostępne dla innych aplikacji, jednak nie powinniśmy przez nie wysyłać danych wrażliwych, na przykład medycznych, bankowych czy urzędowych – tłumaczy Sebastian Kondracki. - Zatem nie mogą z nich korzystać banki, szpitale, kancelarie adwokackie, przychodnie, instytucje publiczne, rządowe czy samorządowe itd. Chcieliśmy to zmienić.

Drugim powodem były kwestie językowe.

- Wydaje się, że chaty doskonale mówią po polsku. Ale jeśli bliżej im się przyjrzymy, to nie jest to do końca prawda – mówi Sebastian Kondracki. – Na przykład tytuły tworzą kapitalikami, czyli stylem anglosaskim. Mają problem z przetłumaczeniem związków frazeologicznych. Bo skąd mają wiedzieć, co znaczy „wyjść jak Zabłocki na mydle” czy „polegać jak na Zawiszy”?

Natomiast gdy poprosimy je, żeby wygenerowały rozmowę dwóch polskich emerytów, to z dużym prawdopodobieństwem możemy zakładać, że na pytanie: „Co u ciebie?”, padnie odpowiedź: „Świetnie”. Podczas gdy nasi seniorzy raczej odpowiedzieliby: ”Stara bida”.

- To może niuanse, ale składają się one na językową autentyczność – wyjaśnia twórca Bielika. – A przy generatorze tekstów jest to bardzo istotne.

Po trzecie model można uruchomić na własnym serwerze lub komputerze z jedną kartą graficzną.

- Bielik jest dużo mniejszym modelem niż ChatGPT. Posiada obecnie maksymalnie 11 mld parametrów – mówi Sebastian Kondracki. – Jego kompaktowość to naszym zdaniem ogromna zaleta.

Lekki, szybki i bezpłatny

Wszystkie te założenia się sprawdziły. Bielik jest wyspecjalizowany do zadań w języku polskim. Doskonale nada się na przykład do generowania opisu produktów, korekty tekstu, streszczenia raportu. A ponadto jest lekki, szybki i bezpłatny.

- To bardzo istotne. Za ChatGPT trzeba zapłacić 20 dolarów. Da się przeżyć w przypadku użytkowników indywidualnych. Ale firmy rozliczają się płacąc za token (więcej niż sylaba, mniej niż słowo). To powoduje, że w dużych firmach czy też w sektorze publicznym, czyli w instytucjach, które przetwarzają mnóstwo dokumentów, zatrudnienie płatnego modelu GPT jest drogie – argumentuje Sebastian Kondracki.

Praca pasjonatów została zauważona. Ostatnio mówił o Bieliku premier Donald Tusk. Miało to miejsce podczas spotkania szefa rządu z wiceprezesem Microsoftu Bradem Smithem.

- Bardzo się cieszę, że prace nad polskim modelem językowym Bielik - zapowiadają się tak obiecująco – komplementował Donald Tusk. - Ten projekt podkreśla ogromny potencjał techniczny i intelektualny polskich kadr - naukowców i informatyków.

Na pewno istnienie polskiego chatu jest też ważne z powodów bezpieczeństwa cyfrowego naszego kraju, co w dzisiejszych czasach jest sprawą kluczową.

Co ten rozgłos przyniesie twórcom chatu?

- Fantastycznie, że premier nas dostrzegł i że sektor publiczny widzi takie projekty, i ich nie blokuje. Ale był taki czas, że opensourcy nie były popularne. To pokazuje, że nasza praca ma sens. – tłumaczy Sebastian Kondracki. – Nie potrzebujemy teraz pieniędzy czy grantów. Działamy oddolnie i obywatelsko. Ważna jest dla nas promocja, bo dzięki niej więcej osób się dowie o Bieliku i być może część z nich dołączy do naszej społeczności. Liczymy też na sponsorów, którzy pomogą nam rozwinąć infrastrukturę.

Obywatel Bielik czeka na pasjonatów

Do projektu może dołączyć każdy. Nie trzeba znać się na algorytmach, programowaniu czy sztucznej inteligencji. Wystarczy podstawowa umiejętność korzystania z komputera oraz Internetu.

- Nasz Bielik jest teraz tylko tekstowy. Ale chcemy iść dalej, w kierunku modelu multimodalnego, żeby też analizował obrazki. To bardzo ważne pod kątem dostępności cyfrowej. Chcemy zrobić aplikację Obywatel Bielik, żeby można było wrzucić zdjęcia np. tradycyjnego obiadu albo zabytków danego regionu, tradycji, kultury, przyrody, słowem tego wszystkiego, co nas otacza – zapowiada Sebastian Kondracki. - Dlatego potrzebujemy przedstawicieli społeczności lokalnej, bibliotekarzy, pasjonatów wszelkiej maści, kół gospodyń wiejskich, seniorów, czyli osób, które mają dużo czasu, sporo wiedzy i chciałyby dołączyć do nas, żeby realny świat przenosić w wirtualną przestrzeń.

Chętni mogą się zgłaszać przez Facebook i LinkedIn.

Pomysłodawca Bielika podkreśla, że twórcy polskiego modelu nie rywalizują z Amerykanami.

- Nie rzuciliśmy im rękawicy. To są zupełnie inne ligi. Budżet OpenAI jest przeogromny – mówi Sebastian Kondracki. - Naszą korelację pokazuje przenośnia transportowa. Dla mnie ChatGPT jest jak metro, przewozi ogromną liczbę „pasażerów”, ale wymaga ogromnej infrastruktury, dużo ludzi do obsługi, buduje się go długo. Nasze modele są furgonetkami. Ale w biznesie często nie potrzeba przewozić towarów metrem. Bardziej sprawdzają się furgonetki lub wózki widłowe. My jesteśmy w tym obszarze. To nie jest rywalizacja, a zupełnie inny segment produktów. Bardzo często potrzebujemy podobnych algorytmów, ale do innych celów. Dziennikarze przypisują nam clickbaitowe, sensacyjne tytuły, które przyciągają czytelników, choć nie do końca są prawdą. Ale dzięki temu dużo ludzi sprawdza naszego Bielika, a o to nam chodzi.

Bielik znacznie podniósł pozycję Polski na arenie unijnej, bo nie każdy kraj może się pochwalić własnym modelem językowym.

- Owszem, można powiedzieć, że nasza infrastruktura superkomputerowa jest niedoinwestowana, bo dopiero rusza. Niedoinwestowane są uczelnie wyższe. Ale mamy najlepszych naukowców na świecie pod względem AI. Nasz Bielik i drugi polski model PLLuM, oba z całym pakietem dostępnych narzędzi i dużymi społecznościami, które nad nimi pracują, sprawiają, że jesteśmy w światowej czołówce – dodaje Sebastian Kondracki.

Bielik jest dostępny pod adresem http://chat.bielik.ai. Twórców można też wesprzeć w serwisie Patronite.pl.

emisja bez ograniczeń wiekowych
Wideo

Świat żegna Franciszka. Tłumy wiernych na Placu św. Piotra

Polecane oferty
* Najniższa cena z ostatnich 30 dniMateriały promocyjne partnera
Wróć na i.pl Portal i.pl