Gemini AI VS ChatGPT: දැවැන්තයින් දෙදෙනෙකුගේ සටන

කෘත්‍රිම බුද්ධිය (AI) ශීඝ්‍රයෙන් දියුණු වන ලෝකය තුළ, මේ වන විට නම් දෙකක් ප්‍රධාන වශයෙන් කතාබහට ලක්ව තිබෙනවා: ඒ Google සමාගමේ Gemini සහ OpenAI සමාගමේ ChatGPT යි. මේ දෙකම ඇදහිය නොහැකි තරම් බලවත් විශාල භාෂා ආකෘති (LLMs) වුවත්, ඒවා එකිනෙකෙහි පිටපත් නම් නොවේ. කෘත්‍රිම බුද්ධිය ගමන් කරන මඟ අගය කිරීමට නම්, මේවායේ මූලික වෙනස්කම් අවබෝධ කර ගැනීම ඉතා වැදගත්. අපි ඒ අතර ඇති ප්‍රධාන වෙනස්කම් දෙකක් විමසා බලමු.

සංසන්දනය 1: සහජ බහුමාධ්‍ය හැකියාව සහ පෙළ (Text) සඳහා මුල්තැන දුන් නිර්මාණය

වඩාත්ම මූලික වෙනස රැඳී ඇත්තේ ඒවායේ නිර්මාණ ශිල්පයෙහිය. 🧠

Gemini මුල සිටම නිර්මාණය කර ඇත්තේ සහජයෙන්ම බහුමාධ්‍ය (natively multimodal) වන ලෙසයි. මෙහි අර්ථය නම්, පෙළ (text), පින්තූර, ශ්‍රව්‍ය (audio), වීඩියෝ සහ කේත (code) වැනි විවිධ තොරතුරු වර්ග එකවර, තනි ඒකකයක් ලෙස තේරුම් ගැනීමට සහ සැකසීමට එය මුල සිටම නිර්මාණය කර ඇති බවයි. එය හරියට, එකවර ගීතයකට සවන් දෙමින්, එහි පද රචනය කියවමින් සහ සංගීත වීඩියෝව නරඹමින්, ඒ සියල්ල අතර ඇති සම්බන්ධය තේරුම් ගන්නා මිනිසෙකු වැනියි. මෙම ඒකාබද්ධ ප්‍රවේශය නිසා විවිධ දත්ත ආකෘති හරහා තර්ක කිරීම අවශ්‍ය වන සංකීර්ණ කාර්යයන් හැසිරවීමට Gemini ට හැකියාව ලැබේ.

[විවිධ දත්ත වර්ග සකසන, ඒකාබද්ධ වූ මොළයක රූපයක්]

අනෙක් අතට, ChatGPT ආරම්භ වූයේ පෙළ-කේන්ද්‍රීය (text-centric) ආකෘතියක් ලෙසයි. එහි මූලික ශක්තිය වන්නේ මිනිසාට සමාන පෙළ තේරුම් ගැනීම සහ ජනනය කිරීමයි. පසුකාලීනව එයට බහුමාධ්‍ය හැකියාවන් (GPT-4V සමඟ පින්තූර තේරුම් ගැනීම වැනි) ලැබී ඇතත්, ඒවා එහි මුල් පෙළ-පදනම මතට එකතු කරන ලද දේවල්ය. එය හරියට එක් භාෂාවක් චතුර ලෙස දන්නා අයෙකු පසුව තවත් භාෂාවක් ඉගෙන ගන්නවා වැනියි; අදහස් පරිවර්තනය කිරීමට සහ සම්බන්ධ කිරීමට හැකි වුවත්, එය උපතින්ම භාෂා දෙකෙන්ම සිතනවාට සමාන නොවේ. මේ නිසා එය සංවාද සහ නිර්මාණාත්මක පෙළ ජනනය කිරීමේදී විශිෂ්ටයෙකු වුවත්, විවිධ දත්ත වර්ග සකසන්නේ සැබවින්ම ඒකාබද්ධ ආකාරයකට වඩා අනුක්‍රමික ආකාරයකටය.

සංසන්දනය 2: තත්‍ය කාලීන තොරතුරු සහ ස්ථාවර දැනුම් පදනම

මෙම ආකෘති තොරතුරු වෙත ප්‍රවේශ වන ආකාරය තවත් තීරණාත්මක සංසන්දනාත්මක කරුණකි. 🌐

Gemini, Google හි පරිසර පද්ධතිය සමඟ ගැඹුරින් ඒකාබද්ධ වී ඇති අතර, එයට අන්තර්ජාලයෙන් තත්‍ය කාලීන තොරතුරු (real-time information) ලබා ගැනීමට සහ සැකසීමට හැකියාව ලබා දෙයි. මෙම සම්බන්ධතාවය නිසා වර්තමාන සහ නවතම වර්ධනයන් відображаනය කරන පිළිතුරු සහ තීක්ෂ්ණ බුද්ධිය ලබා දීමට එයට හැකි වේ. උදාහරණයක් ලෙස, අද කොටස් වෙළඳපොළ ප්‍රවෘත්ති සාරාංශගත කර, සජීවී ලිපි සහ සමාජ මාධ්‍ය සටහන් මත පදනම්ව එහි හැඟීම් විශ්ලේෂණය කරන ලෙස ඔබට Gemini ගෙන් ඉල්ලා සිටිය හැක. එහි පිළිතුරු ගතික වන අතර නව තොරතුරු ලැබෙන විට වෙනස් විය හැක.

ChatGPT (එහි සම්මත අනුවාදවල) ප්‍රධාන වශයෙන් ක්‍රියාත්මක වන්නේ ස්ථාවර දැනුම් පදනමක් (fixed knowledge base) මතය. එය පුහුණු කර ඇත්තේ නිශ්චිත කඩඉම් දිනයක් සහිත, දැවැන්ත නමුත් සීමිත දත්ත කට්ටලයක් මතය. එහි පුහුණුව අවසන් වීමෙන් පසුව සිදු වූ සිදුවීම් පිළිබඳව, බ්‍රවුසින් ප්ලගිනයක් භාවිතා නොකරන්නේ නම්, පැවසීමට එයට නොහැකිය. මෙමගින් එහි ප්‍රතිචාර ඉතා ස්ථාවර වුවත්, ශීඝ්‍රයෙන් වෙනස් වන මාතෘකා සම්බන්ධයෙන් ඒවා යල් පැන ගිය ඒවා විය හැකිය.

[ගතික, සම්බන්ධිත ජාලයකට එදිරිව ස්ථිතික පුස්තකාලයක රූපයක්]

අවසාන නිගමනය
ඉතින්, ජයග්‍රාහකයා කවුද? එය ජයග්‍රාහකයෙකු ගැන නොව, නියම කාර්යය සඳහා නියම මෙවලම තෝරා ගැනීම ගැනය.

ChatGPT තෝරාගන්න: එහි ඔපවත් සහ බලවත් සංවාද හැකියාවන්, නිර්මාණාත්මක ලේඛන කටයුතු සහ එහි විශාල නමුත් ස්ථාවර දැනුම් පදනම මත රඳා පවතින කාර්යයන් සඳහා. එය සුවිශේෂී වචන ශිල්පියෙකු සහ නිර්මාණශීලී සහකරුවෙකි.

Gemini වෙත යොමුවන්න: විවිධ තොරතුරු වර්ග (වීඩියෝවක ශ්‍රව්‍ය සහ දෘශ්‍ය අංග එකවර විශ්ලේෂණය කිරීම වැනි) හරස් යොමු කිරීම අවශ්‍ය වන සංකීර්ණ, බහුවිධ කාර්යයන් සඳහා සහ වඩාත්ම යාවත්කාලීන, තත්‍ය කාලීන දත්ත අවශ්‍ය වන විමසීම් සඳහා.

මෙම ආකෘති දෙකම කළ හැකි දේවල සීමාවන් පුළුල් කරමින් සිටින අතර, ඒවායේ පැහැදිලි ප්‍රවේශයන් කෘත්‍රිම බුද්ධියේ අනාගතය වෙත අපව උද්වේගකර, සමාන්තර මාර්ග දෙකකින් ගෙන යයි.සංසන්දනය 1: සහජ බහුමාධ්‍ය හැකියාව සහ පෙළ (Text) සඳහා මුල්තැන දුන් නිර්මාණය
වඩාත්ම මූලික වෙනස රැඳී ඇත්තේ ඒවායේ නිර්මාණ ශිල්පයෙහිය. 🧠

Gemini මුල සිටම නිර්මාණය කර ඇත්තේ සහජයෙන්ම බහුමාධ්‍ය (natively multimodal) වන ලෙසයි. මෙහි අර්ථය නම්, පෙළ (text), පින්තූර, ශ්‍රව්‍ය (audio), වීඩියෝ සහ කේත (code) වැනි විවිධ තොරතුරු වර්ග එකවර, තනි ඒකකයක් ලෙස තේරුම් ගැනීමට සහ සැකසීමට එය මුල සිටම නිර්මාණය කර ඇති බවයි. එය හරියට, එකවර ගීතයකට සවන් දෙමින්, එහි පද රචනය කියවමින් සහ සංගීත වීඩියෝව නරඹමින්, ඒ සියල්ල අතර ඇති සම්බන්ධය තේරුම් ගන්නා මිනිසෙකු වැනියි. මෙම ඒකාබද්ධ ප්‍රවේශය නිසා විවිධ දත්ත ආකෘති හරහා තර්ක කිරීම අවශ්‍ය වන සංකීර්ණ කාර්යයන් හැසිරවීමට Gemini ට හැකියාව ලැබේ.

[විවිධ දත්ත වර්ග සකසන, ඒකාබද්ධ වූ මොළයක රූපයක්]

අනෙක් අතට, ChatGPT ආරම්භ වූයේ පෙළ-කේන්ද්‍රීය (text-centric) ආකෘතියක් ලෙසයි. එහි මූලික ශක්තිය වන්නේ මිනිසාට සමාන පෙළ තේරුම් ගැනීම සහ ජනනය කිරීමයි. පසුකාලීනව එයට බහුමාධ්‍ය හැකියාවන් (GPT-4V සමඟ පින්තූර තේරුම් ගැනීම වැනි) ලැබී ඇතත්, ඒවා එහි මුල් පෙළ-පදනම මතට එකතු කරන ලද දේවල්ය. එය හරියට එක් භාෂාවක් චතුර ලෙස දන්නා අයෙකු පසුව තවත් භාෂාවක් ඉගෙන ගන්නවා වැනියි; අදහස් පරිවර්තනය කිරීමට සහ සම්බන්ධ කිරීමට හැකි වුවත්, එය උපතින්ම භාෂා දෙකෙන්ම සිතනවාට සමාන නොවේ. මේ නිසා එය සංවාද සහ නිර්මාණාත්මක පෙළ ජනනය කිරීමේදී විශිෂ්ටයෙකු වුවත්, විවිධ දත්ත වර්ග සකසන්නේ සැබවින්ම ඒකාබද්ධ ආකාරයකට වඩා අනුක්‍රමික ආකාරයකටය.

සංසන්දනය 2: තත්‍ය කාලීන තොරතුරු සහ ස්ථාවර දැනුම් පදනම
මෙම ආකෘති තොරතුරු වෙත ප්‍රවේශ වන ආකාරය තවත් තීරණාත්මක සංසන්දනාත්මක කරුණකි. 🌐

Gemini, Google හි පරිසර පද්ධතිය සමඟ ගැඹුරින් ඒකාබද්ධ වී ඇති අතර, එයට අන්තර්ජාලයෙන් තත්‍ය කාලීන තොරතුරු (real-time information) ලබා ගැනීමට සහ සැකසීමට හැකියාව ලබා දෙයි. මෙම සම්බන්ධතාවය නිසා වර්තමාන සහ නවතම වර්ධනයන් відображаනය කරන පිළිතුරු සහ තීක්ෂ්ණ බුද්ධිය ලබා දීමට එයට හැකි වේ. උදාහරණයක් ලෙස, අද කොටස් වෙළඳපොළ ප්‍රවෘත්ති සාරාංශගත කර, සජීවී ලිපි සහ සමාජ මාධ්‍ය සටහන් මත පදනම්ව එහි හැඟීම් විශ්ලේෂණය කරන ලෙස ඔබට Gemini ගෙන් ඉල්ලා සිටිය හැක. එහි පිළිතුරු ගතික වන අතර නව තොරතුරු ලැබෙන විට වෙනස් විය හැක.

ChatGPT (එහි සම්මත අනුවාදවල) ප්‍රධාන වශයෙන් ක්‍රියාත්මක වන්නේ ස්ථාවර දැනුම් පදනමක් (fixed knowledge base) මතය. එය පුහුණු කර ඇත්තේ නිශ්චිත කඩඉම් දිනයක් සහිත, දැවැන්ත නමුත් සීමිත දත්ත කට්ටලයක් මතය. එහි පුහුණුව අවසන් වීමෙන් පසුව සිදු වූ සිදුවීම් පිළිබඳව, බ්‍රවුසින් ප්ලගිනයක් භාවිතා නොකරන්නේ නම්, පැවසීමට එයට නොහැකිය. මෙමගින් එහි ප්‍රතිචාර ඉතා ස්ථාවර වුවත්, ශීඝ්‍රයෙන් වෙනස් වන මාතෘකා සම්බන්ධයෙන් ඒවා යල් පැන ගිය ඒවා විය හැකිය.

[ගතික, සම්බන්ධිත ජාලයකට එදිරිව ස්ථිතික පුස්තකාලයක රූපයක්]

අවසාන නිගමනය
ඉතින්, ජයග්‍රාහකයා කවුද? එය ජයග්‍රාහකයෙකු ගැන නොව, නියම කාර්යය සඳහා නියම මෙවලම තෝරා ගැනීම ගැනය.

ChatGPT තෝරාගන්න: එහි ඔපවත් සහ බලවත් සංවාද හැකියාවන්, නිර්මාණාත්මක ලේඛන කටයුතු සහ එහි විශාල නමුත් ස්ථාවර දැනුම් පදනම මත රඳා පවතින කාර්යයන් සඳහා. එය සුවිශේෂී වචන ශිල්පියෙකු සහ නිර්මාණශීලී සහකරුවෙකි.

Gemini වෙත යොමුවන්න: විවිධ තොරතුරු වර්ග (වීඩියෝවක ශ්‍රව්‍ය සහ දෘශ්‍ය අංග එකවර විශ්ලේෂණය කිරීම වැනි) හරස් යොමු කිරීම අවශ්‍ය වන සංකීර්ණ, බහුවිධ කාර්යයන් සඳහා සහ වඩාත්ම යාවත්කාලීන, තත්‍ය කාලීන දත්ත අවශ්‍ය වන විමසීම් සඳහා.

මෙම ආකෘති දෙකම කළ හැකි දේවල සීමාවන් පුළුල් කරමින් සිටින අතර, ඒවායේ පැහැදිලි ප්‍රවේශයන් කෘත්‍රිම බුද්ධියේ අනාගතය වෙත අපව උද්වේගකර, සමාන්තර මාර්ග දෙකකින් ගෙන යයි.

Post a Comment

0 Comments