Ceangail le linn

Faisnéise Saorga

Qwen2 – Tugann an tSamhail Teanga Ilteangach is Déanaí de chuid Alibaba Dúshlán do SOTA cosúil le Llama 3

mm
Nuashonraithe on
éabhlóid ó Qwen1.5 go Qwen2

Tar éis míonna súil, Nocht foireann Qwen Alibaba faoi dheireadh Qwen2 – an chéad éabhlóid eile dá sraith samhail teanga chumhachtach. Is céim shuntasach chun cinn é Qwen2, agus tá dul chun cinn ceannródaíoch ann a d’fhéadfadh é a shuíomh mar an rogha is fearr le Meta a cheiliúradh. Láma 3 Mionsamhail. Sa tumadh domhain teicniúil seo, scrúdóimid na príomhghnéithe, na tagarmharcanna feidhmíochta, agus na teicníochtaí nuálacha a fhágann go bhfuil Qwen2 ina iomaitheoir iontach i réimse na múnlaí móra teanga (LLManna).

Scálú Suas: Ag Tabhairt isteach Líne Samhail Qwen2

Ag croílár Qwen2 Tá raon éagsúil samhlacha atá oiriúnaithe chun freastal ar éilimh ríomhaireachta éagsúla. Cuimsíonn an tsraith cúig mhúnla ar leith: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, agus an príomhthionscadal Qwen2-72B. Freastalaíonn an raon roghanna seo ar speictream leathan úsáideoirí, ó iad siúd a bhfuil acmhainní measartha crua-earraí acu go dtí iad siúd a bhfuil rochtain acu ar bhonneagar ríomhaireachtúil ceannródaíoch.

Ceann de na gnéithe suntasacha atá ag Qwen2 ná a chumais ilteangacha. Cé go bhfuil an roimhe seo Qwen1.5 an tsamhail sármhaith sa Bhéarla agus sa tSínis, cuireadh oiliúint ar Qwen2 ar shonraí a chuimsíonn 27 teanga bhreise. Áiríonn an réimeas oiliúna ilteangach seo teangacha ó réigiúin éagsúla mar Iarthar na hEorpa, Oirthear agus Lár na hEorpa, an Meánoirthear, Oirthear na hÁise agus Deisceart na hÁise.

Tábla ina liostaítear na teangacha a fhaigheann tacaíocht ó mhúnlaí Qwen2, catagóirithe de réir réigiúin

Teangacha tacaithe ag samhlacha Qwen2, catagóirithe de réir réigiúin thíreolaíocha

Trí leathnú a dhéanamh ar a stór teanga, léiríonn Qwen2 cumas eisceachtúil chun ábhar a thuiscint agus a ghiniúint thar raon leathan teangacha, rud a fhágann gur uirlis fhíorluachmhar é le haghaidh feidhmeanna domhanda agus cumarsáide traschultúrtha.

 

Tábla ag déanamh comparáide idir samhlacha Qwen2 de réir paraiméadair, paraiméadair neamh-leabaithe, GQA, leabú carbhat, agus fad comhthéacs

Sonraíochtaí Múnlaí Qwen2 lena n-áirítear paraiméadair, GQA, agus fad an chomhthéacs.

Ag Tabhairt Aghaidh ar Athrú Cóid: Dúshlán Ilteangach

I gcomhthéacsanna ilteangacha, is rud coitianta é feiniméan an chóidmhalartaithe – an cleachtas a bhaineann le malairt teangacha laistigh d’aon chomhrá nó d’aon chaint amháin. Tá Qwen2 oilte go cúramach chun cásanna aistrithe cód a láimhseáil, ag laghdú go suntasach na saincheisteanna gaolmhara agus ag cinntiú aistrithe réidhe idir teangacha.

Deimhníodh le meastóireachtaí a úsáideann leideanna a chothaíonn malartú cód go hiondúil go bhfuil feabhas suntasach ar Qwen2 sa réimse seo, fianaise ar thiomantas Alibaba do mhúnla teanga fíor-ilteangach a sheachadadh.

Sármhaitheas sa Chódú agus sa Mhatamaitic

Tá cumais shuntasacha ag Qwen2 i réimsí an chódú agus na matamaitice, réimsí a raibh dúshláin traidisiúnta ag baint leo do mhúnlaí teanga. Trí thacair sonraí fairsinge ardcháilíochta agus modheolaíochtaí oiliúna optamaithe a ghiaráil, taispeánann Qwen2-72B-Instruct, an t-athraitheach teagasc-tiúnta den tsamhail shuaitheanta, sárfheidhmíocht i réiteach fadhbanna matamaitice agus tascanna códaithe thar teangacha ríomhchlárúcháin éagsúla.

Comhthéacs a Leathnú

Ceann de na gnéithe is suntasaí de Qwen2 ná a chumas seichimh comhthéacs leathnaithe a thuiscint agus a phróiseáil. Cé go mbíonn formhór na múnlaí teanga ag streachailt le téacs fadfhoirmeálta, tá innealtóireacht déanta ar mhúnlaí Qwen2-7B-Instruct agus Qwen2-72B-Instruct chun faid comhthéacs suas le 128K comharthaí a láimhseáil.

Athraítear an cumas suntasach seo d’fheidhmchláir a éilíonn tuiscint dhomhain ar dhoiciméid fhada, mar chonarthaí dlí, páipéir thaighde, nó lámhleabhair theicniúla dlútha. Trí chomhthéacsanna sínte a phróiseáil go héifeachtach, is féidir le Qwen2 freagraí níos cruinne agus níos cuimsithí a sholáthar, ag scaoileadh teorainneacha nua i bpróiseáil teanga nádúrtha.

Cairt a thaispeánann cruinneas aisghabhála fíricí samhlacha Qwen2 thar faid éagsúla comhthéacs agus doimhneacht doiciméad

Cruinneas samhlacha Qwen2 maidir le fíricí a aisghabháil ó dhoiciméid thar faid éagsúla comhthéacs agus doimhneacht doiciméad.

Léiríonn an chairt seo cumas na múnlaí Qwen2 fíricí a aisghabháil ó dhoiciméid a bhfuil faid agus doimhneachtaí comhthéacs éagsúla acu.

Nuálaíochtaí Ailtireachta: Ceist an Ghrúpa Aire agus Leabaithe Optamaithe

Faoin gcochall, ionchorpraíonn Qwen2 roinnt nuálaíochtaí ailtireachta a chuireann lena fheidhmíocht eisceachtúil. Ceann de na nuálaíochtaí sin is ea glacadh le Grúpa ar Cheisteanna a Dhéanamh (GQA) ar fud gach múnla. Cuireann GQA luasanna tátail níos tapúla agus úsáid chuimhne laghdaithe ar fáil, rud a fhágann go bhfuil Qwen2 níos éifeachtaí agus níos inrochtana do raon níos leithne de chumraíochtaí crua-earraí.

Ina theannta sin, tá barrfheabhsú déanta ag Alibaba ar an leabaithe do mhúnlaí níos lú sa tsraith Qwen2. Trí leabaithe a cheangal, d'éirigh leis an bhfoireann lorg cuimhne na múnlaí seo a laghdú, rud a chuir ar a gcumas iad a úsáid ar chrua-earraí nach bhfuil chomh cumhachtach agus ag an am céanna feidhmíocht ardcháilíochta a chothabháil.

Tagarmharcáil Qwen2: Sár-fheidhmíocht na Múnlaí Nua-Aimseartha

Tá feidhmíocht iontach ag Qwen2 thar raon éagsúil tagarmharcanna. Léiríonn meastóireachtaí comparáideacha go sáraíonn Qwen2-72B, an tsamhail is mó sa tsraith, iomaitheoirí mór le rá mar Llama-3-70B i réimsí ríthábhachtacha, lena n-áirítear tuiscint teanga nádúrtha, sealbhú eolais, inniúlacht códaithe, scileanna matamaitice, agus cumais ilteangacha.

Cairteacha a dhéanann comparáid idir Qwen2-72B-Instruct agus Llama3-70B-Instruct i gcódú thar roinnt teangacha ríomhchlárúcháin agus sa mhatamaitic thar scrúduithe éagsúla

Qwen2-72B-Teagmhaigh versus Llama3-70B-Teagasc maidir le códú agus feidhmíocht matamaitice

In ainneoin go bhfuil níos lú paraiméadair aige ná a réamhtheachtaí, léiríonn Qwen1.5-110B, Qwen2-72B feidhmíocht níos fearr, teist ar éifeachtúlacht thacair sonraí coimeádta Alibaba agus modheolaíochtaí oiliúna optamaithe.

Sábháilteacht agus Freagracht: Ag Ailíniú le Luachanna Daonna

Tá measúnú dian déanta ar Qwen2-72B-Instruct as a chumas déileáil le fiosrúcháin a d’fhéadfadh a bheith díobhálach a bhaineann le gníomhaíochtaí mídhleathacha, calaois, pornagrafaíocht agus sáruithe príobháideachta. Is ábhar misnigh iad na torthaí: Feidhmíonn Qwen2-72B-Instruct inchomparáide leis an tsamhail GPT-4 a bhfuil ardmheas air ó thaobh sábháilteachta de, ag taispeáint comhréireanna i bhfad níos ísle de fhreagairtí díobhálacha i gcomparáid le samhlacha móra eile cosúil le Mistral-8x22B.

Leagann an gnóthachtáil seo béim ar thiomantas Alibaba do chórais AI a fhorbairt a ailíníonn le luachanna daonna, ag cinntiú go bhfuil Qwen2 ní hamháin cumhachtach ach freisin iontaofa agus freagrach.

Ceadúnú agus Tiomantas Foinse Oscailte

I mbeart a mhéadaíonn tionchar Qwen2 tuilleadh, tá cur chuige foinse oscailte glactha ag Alibaba maidir le ceadúnú. Cé go gcoimeádann Qwen2-72B agus a mhúnlaí treoraithe an Ceadúnas bunaidh Qianwen, tá na samhlacha atá fágtha – Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, agus Qwen2-57B-A14B – ceadúnaithe faoin gceadúnas ceadaitheach Apache 2.0 .

Táthar ag súil go gcuirfidh an oscailteacht fheabhsaithe seo dlús le cur i bhfeidhm agus úsáid tráchtála samhlacha Qwen2 ar fud an domhain, ag cothú comhoibriú agus nuálaíocht laistigh den phobal domhanda AI.

Úsáid agus Cur i bhFeidhm

Tá sé simplí samhlacha Qwen2 a úsáid, a bhuíochas dá gcomhtháthú le creataí coitianta cosúil le Aghaidh Hugging. Seo sampla d’úsáid Qwen2-7B-Chat-beta le haghaidh tátail:

from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda" # the device to load the model onto
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen1.5-7B-Chat", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen1.5-7B-Chat")
prompt = "Give me a short introduction to large language models."
messages = [{"role": "user", "content": prompt}]
text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
model_inputs = tokenizer([text], return_tensors="pt").to(device)
generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=512, do_sample=True)
generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

Léiríonn an mhír chóid seo conas téacs a shocrú agus a ghiniúint ag baint úsáide as samhail Qwen2-7B-Chat. An comhtháthú le Aghaidh Hugging déanann sé inrochtana agus éasca triail a bhaint as.

Qwen2 vs Láma 3: Anailís Chomparáideach

Cé go Qwen2 agus Cluiche Meta's Lama 3 is múnlaí teanga iontacha iad araon, léiríonn siad láidreachtaí agus comhbhabhtálacha ar leith.

Cairt comparáide feidhmíochta de Qwen2-72B, Llama3-70B, Mixtral-8x22B, agus Qwen1.5-110B thar tagarmharcanna iolracha

Cairt feidhmíochta comparáideach de Qwen2-72B, Llama3-70B, Mixtral-8x22B, agus Qwen1.5-110B thar tagarmharcanna éagsúla lena n-áirítear MMLU, MMLU-Pro, GPQA, agus daoine eile.

Seo anailís chomparáideach chun cabhrú leat a bpríomhdhifríochtaí a thuiscint:

Cumais Ilteangacha: Tá buntáiste soiléir ag Qwen2 maidir le tacaíocht ilteangach. Cuireann a oiliúint ar shonraí a chuimsíonn 27 teanga bhreise, seachas Béarla agus Sínis, ar chumas Qwen2 barr feabhais a chur ar chumarsáid traschultúrtha agus cásanna ilteangacha. I gcodarsnacht leis sin, níl cumas ilteangach Llama 3 chomh soiléir sin, rud a d’fhéadfadh teorainn a chur lena éifeachtacht i gcomhthéacsanna teanga éagsúla.

Inniúlacht Códú agus Matamaitice: An dá Qwen2 agus Láma 3 cumas iontach códaithe agus matamaitice a léiriú. Mar sin féin, is cosúil go bhfuil buntáiste beag ag Qwen2-72B-Instruct, mar gheall ar an oiliúint dhian atá aige ar thacair shonraí fhairsing ardcháilíochta sna fearainn seo. D’fhéadfadh fócas Alibaba ar chumais Qwen2 a fheabhsú sna réimsí seo buntáiste a thabhairt dó d’fheidhmchláir speisialaithe a bhaineann le códú nó le réiteach fadhbanna matamaitice.

Tuiscint Chomhthéacs Fada: Bródúil as samhlacha Qwen2-7B-Instruct agus Qwen2-72B-Instruct cumas iontach chun faid comhthéacs de suas le 128K comharthaí a láimhseáil. Tá an ghné seo fíorluachmhar d’fheidhmchláir a éilíonn tuiscint dhomhain ar dhoiciméid fhada nó ábhair theicniúla dlúth. Cé go bhfuil Lama 3 in ann seichimh fhada a phróiseáil, seans nach mbeidh feidhmíocht Qwen2 sa réimse sonrach seo ag teacht leis.

Cé go léiríonn Qwen2 agus Llama 3 araon feidhmíocht úrscothach, cuireann raon múnla éagsúil Qwen2, ó pharaiméadair 0.5B go 72B, níos mó solúbthachta agus inscálaithe ar fáil. Ligeann an solúbthacht seo d’úsáideoirí an méid múnla is fearr a oireann dá n-acmhainní ríomhaireachtúla agus dá riachtanais feidhmíochta a roghnú. Ina theannta sin, d'fhéadfadh iarrachtaí leanúnacha Alibaba Qwen2 a scála go samhlacha níos mó a chumais a fheabhsú tuilleadh, rud a d'fhéadfadh dul thar Lama 3 amach anseo.

Imlonnú agus Comhtháthú: Glacadh Qwen2 a Shimpliú

Chun glacadh agus comhtháthú forleathan Qwen2 a éascú, tá céimeanna réamhghníomhacha glactha ag Alibaba chun imscaradh gan uaim a chinntiú thar ardáin agus creataí éagsúla. Tá foireann Qwen tar éis comhoibriú go dlúth le go leor tionscadal agus eagraíochtaí tríú páirtí, rud a chuir ar chumas Qwen2 a ghiaráil i gcomhar le raon leathan uirlisí agus creataí.

Mionchoigeartú agus Cainníochtú: Tá tionscadail tríú páirtí cosúil le Axolotl, Llama-Factory, Firefly, Swift, agus XTuner optamaithe chun tacú le samhlacha Qwen2 mionchoigeartaithe, rud a chuireann ar chumas úsáideoirí na samhlacha a chur in oiriúint dá gcuid tascanna agus tacair shonraí ar leith. Ina theannta sin, is maith le huirlisí cainníochtaithe AutoGPTQ, AutoAWQ, agus Neural Compressor curtha in oiriúint le bheith ag obair le Qwen2, ag éascú imscaradh éifeachtach ar fheistí a bhfuil srian acmhainní orthu.

Imscaradh agus Tátail: Is féidir samhlacha Qwen2 a imscaradh agus a sheirbheáil trí úsáid a bhaint as creataí éagsúla, lena n-áirítear vLLM, SGL, SkyPilot, TensorRT-LLM, Oscail Vino, agus TGI. Cuireann na creataí seo píblínte tátal optamaithe ar fáil, rud a chumasaíonn imscaradh éifeachtach agus inscálaithe Qwen2 i dtimpeallachtaí táirgthe.

Ardáin API agus Forghníomhú Áitiúil: D'fhorbróirí atá ag iarraidh Qwen2 a chomhtháthú ina bhfeidhmchláir, cuireann ardáin API ar nós Le Chéile, Tinte ealaíne, agus OpenRouter rochtain áisiúil ar chumas na samhlacha. De rogha air sin, tacaítear le forghníomhú áitiúil trí chreataí mar MLX, Llama.cpp, Olama, agus LM Studio, rud a ligeann d'úsáideoirí Qwen2 a rith ar a n-innill áitiúla agus smacht á choinneáil acu ar phríobháideachas agus slándáil sonraí.

Creataí Gníomhaire agus RAG: Tá tacaíocht Qwen2 d'úsáid uirlisí agus cumais ghníomhaire treisithe ag creataí cosúil le Innéacs Láma, CrewAI, agus OscailDevin. Cuireann na creataí seo ar chumas sainghníomhairí AI a chruthú agus Qwen2 a chomhtháthú isteach glúin mhéadaithe aisghabhála (RAG) píblínte, ag leathnú raon na n-iarratas agus na gcásanna úsáide.

Ag Breathnú Chun Cinn: Forbairtí agus Deiseanna sa Todhchaí

Síneann fís Alibaba do Qwen2 i bhfad níos faide ná an scaoileadh reatha. Tá an fhoireann ag traenáil múnlaí níos mó go gníomhach chun iniúchadh a dhéanamh ar theorainneacha an scálaithe samhlacha, arna chomhlánú ag iarrachtaí leanúnacha scálaithe sonraí. Ina theannta sin, tá pleananna ar bun chun Qwen2 a leathnú isteach i réimse an AI ilmhódúil, rud a chumasóidh comhtháthú cumais fís agus tuisceana.

De réir mar a leanann an t-éiceachóras AI foinse oscailte ag dul chun cinn, beidh ról lárnach ag Qwen2, ag feidhmiú mar acmhainn chumhachtach do thaighdeoirí, d’fhorbróirí agus d’eagraíochtaí atá ag iarraidh an úrscothacht a chur chun cinn i bpróiseáil teanga nádúrtha agus in intleacht shaorga.

Tá cúig bliana anuas caite agam ag tumadh mé féin i ndomhan iontach na Foghlama Meaisín agus an Fhoghlaim Dhomhain. Chuir mo phaisean agus mo shaineolas orm cur le breis agus 50 tionscadal innealtóireachta bogearraí éagsúla, le fócas ar leith ar AI/ML. Tá mo fiosracht leanúnach tar éis mé a tharraingt i dtreo Próiseáil Teanga Nádúrtha, réimse a bhfuil fonn orm tuilleadh a chíoradh.