3,615 ການອ່ານ
3,615 ການອ່ານ

AI ຕ້ອງຂໍ້ມູນທີ່ດີກວ່າ, ບໍ່ພຽງແຕ່ຮູບແບບຂະຫນາດໃຫຍ່

ໂດຍ Dan Stein4m2025/05/05
Read on Terminal Reader

ຍາວເກີນໄປ; ອ່ານ

LLMs ມີການປ່ຽນແປງຢ່າງໄວ້ວາງໃຈ - ເຮັດໃຫ້ສິ່ງທີ່ຮູ້ສຶກວ່າບໍ່ສາມາດ. ແຕ່ຄວາມປອດໄພຂະຫນາດໃຫຍ່ຍັງມີ. CEO ຂອງ Sapien Rowan Stone ຂ້າງຂວາງສິ່ງທີ່ເຮັດວຽກແລະສິ່ງທີ່ຈໍາເປັນຕ້ອງປິ່ນປົວ.
featured image - AI ຕ້ອງຂໍ້ມູນທີ່ດີກວ່າ, ບໍ່ພຽງແຕ່ຮູບແບບຂະຫນາດໃຫຍ່
Dan Stein HackerNoon profile picture

LLMs ໄດ້ປ່ຽນແປງຢ່າງວ່ອງໄວແລະພວກເຂົາເຈົ້າໄດ້ເຮັດໄດ້ຢ່າງວ່ອງໄວຫຼາຍກ່ວາພວກເຮົາມີຫຼາຍກ່ວາພວກເຮົາມີການຄາດວ່າ. ພວກເຮົາມີຄວາມຮູ້ສຶກວ່າພວກເຂົາເຈົ້າເຮັດສິ່ງທີ່ພວກເຂົາໄດ້ຮູ້ສຶກບໍ່ສາມາດໃນໄລຍະຫຼາຍປີທີ່ຜ່ານມາ. ແຕ່ຫຼັງຈາກການ hype ທັງຫມົດ, ມັນຍັງມີປະສົບການຂະຫນາດໃຫຍ່, ເຊັ່ນດຽວກັນກັບຂໍ້ມູນທີ່ຝຶກອົບຮົມຮູບແບບເຫຼົ່ານີ້.ປະເພດ SapienCEO Rowan Stone ເພື່ອໄດ້ຮັບການນໍາໃຊ້ຂອງຕົນກ່ຽວກັບສິ່ງທີ່ເຮັດວຽກ, ສິ່ງທີ່ຍັງຄວນປັບປຸງ, ແລະວິທີທີ່ Sapien ແມ່ນປິ່ນປົວບັນຫາຈາກທົ່ວໄປ.

ປະເພດ Sapien

ການພັດທະນາຂອງ Models ຂະຫນາດໃຫຍ່ໄດ້ຢ່າງງ່າຍດາຍໃນປີທີ່ຜ່ານມາ. ວິທີການຄາດຄະເນການປັບປຸງ, ແລະສິ່ງທີ່ສາມາດປັບປຸງ?

ມັນບໍ່ເຄື່ອນໄຫວວ່າການປັບປຸງໃນ LLMs ໄດ້ສ້າງໂຄງສ້າງສະພາບແວດລ້ອມ AI ໃນມື້ນີ້. ການປັບປຸງໃນໄລຍະປີທີ່ຜ່ານມາໄດ້ຢ່າງງ່າຍດາຍ - ພວກເຂົາເຈົ້າໄດ້ປັບປຸງຢ່າງງ່າຍດາຍໃນຄຸນນະພາບການປິ່ນປົວລະດັບຊາດ. ຢ່າງໃດກໍຕາມ, ການຝຶກອົບຮົມຮູບແບບເຫຼົ່ານີ້ຄຸນນະສົມບັດຂະຫນາດໃຫຍ່ຂອງຂໍ້ມູນ. ມັນເປັນພື້ນຖານທີ່, ບໍ່ວ່າຈະຊ່ວຍໃຫ້ບໍລິສັດຫຼາຍ, ແຕ່ຍັງຄຸນນະສົມບັດການເຮັດວຽກ. ລະບົບຂໍ້ມູນທີ່ຈໍາກັດແມ່ນການປິ່ນປົວ. ພວກເຂົາເຈົ້າສາມາດຂັບຕົວແບບຂອງຂໍ້ມູນທີ່ພວກເຂົາຕ້ອງຊອກຫາສໍາລັບການສະຫນອງການບໍລິການປະສິດທິພາບແລະປະສິດທິພາບ.


ຄ່າໃຊ້ຈ່າຍຂອງການຂະຫຍາຍຕົວ bias ແມ່ນປະໂຫຍດທີ່ແທ້ຈິງ, ເຊິ່ງສາມາດເຮັດໃຫ້ການ repetition ຂອງ stereotypes ແລະຄວາມບໍ່ເສຍຄ່າຂອງ generalizability.


ພວກເຮົາ, ໃນ Sapien, ການປິ່ນປົວຄວາມປອດໄພ, scalability, ແລະຄວາມຊ່ຽວຊານ - these three are our pillars. We ensure that the data collected for LLM training is of high quality. We have formed a system where LLMs can be fine-tuned with expert human feedback. A human-in-the-loop labelling process helps deliver real-time feedback for fine-tuning datasets to build the most performing and differentiated AI models.

ຖ້າຫາກວ່າທ່ານກໍາລັງຊອກຫາຜູ້ຊ່ຽວຊານຂອງມະນຸດ, ທ່ານສາມາດປັບປຸງຄວາມຖືກຕ້ອງຂອງ LLM?

ພວກເຮົາມີຄວາມຮູ້ສຶກວ່າການຮ່ວມມືຂອງຜູ້ຊ່ຽວຊານຂອງມະນຸດແມ່ນສໍາຄັນສໍາລັບການປັບປຸງຄວາມຖືກຕ້ອງຂອງ LLM, ລວມທັງໃນພາກສ່ວນທີ່ຄວາມຮູ້ສຶກອົບຮົມຂອງມະນຸດແມ່ນປົກກະຕິ. ຜູ້ຊ່ຽວຊານຂອງພວກເຮົາມີຄວາມຮູ້ສຶກອົບຮົມຂອງມະນຸດທີ່ສະຫນັບສະຫນູນການນໍາໃຊ້ Natural Language Processing. ພວກເຮົາມີຄວາມຮູ້ສຶກອົບຮົມໃນພາກສ່ວນທີ່ຄວາມຮູ້ສຶກອົບຮົມຂອງມະນຸດແມ່ນສໍາຄັນ.


ສໍາລັບການຄວບຄຸມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມສະພາບແວດລ້ອມ


ຊື່ຫຍໍ້ຂອງ : IT trainees can also identify user intentions and goals by tagging customer service transcripts. ນອກເຫນືອໄປຈາກນັ້ນ, ພວກເຮົາ annotate FAQs, manuals, and documents to train QA systems, and label text in multiple languages to develop more reliable machine translation tools.


ການຄົ້ນຄວ້າຂອງພວກເຮົາແມ່ນຂະຫນາດໃຫຍ່, ແລະການປິ່ນປົວຂອງຜູ້ຊ່ຽວຊານນີ້ໄດ້ປັບປຸງຄວາມຖືກຕ້ອງຂອງຮູບແບບໂດຍຜ່ານການປິ່ນປົວຄວາມເຄື່ອນໄຫວ, ການປິ່ນປົວ bias, ແລະຄວາມເຂັ້ມແຂງລະອຽດ.

ການພັດທະນາ AI ທີ່ດີເລີດຍັງຄວນຮູ້ຮູບພາບ. ວິທີການປິ່ນປົວກໍລະນີການນໍາໃຊ້ທີ່ກ່ຽວຂ້ອງກັບຮູບພາບ?

ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີ. ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີທີ່ມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີ. ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີທີ່ມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີ. ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີທີ່ມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີທີ່ມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີທີ່ມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີ. ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິວເຕີທີ່ມີຄວາມຊ່ຽວຊານໃນການຄົ້ນຄວ້າຄອມພິ

ໃນປັດຈຸບັນ, ພວກເຮົາມີຄວາມຮູ້ສຶກຫຼາຍກ່ຽວກັບສອງ paradigms ເຕັກໂນໂລຊີສູງ – decentralization ແລະ AI – coming together to scale efficiently. You consider this an effective synergy?

ພວກເຮົາມີຄວາມຮູ້ສຶກວ່າບໍລິສັດຂະຫນາດໃຫຍ່ໄດ້ປ່ຽນແປງກັບອຸປະກອນຂໍ້ມູນ centered ທີ່ໄດ້ຮັບການປະໂຫຍດ Milliards ໂດຍໃຊ້ການບໍລິການຂອງມະນຸດຂອງມະນຸດເພື່ອສ້າງແລະສ້າງຂໍ້ມູນເພື່ອສະຫນັບສະຫນູນແບບຂອງເຂົາເຈົ້າ - ມັນສາມາດສະແດງໃຫ້ເຫັນວ່າມີປະສິດທິພາບ. ແຕ່, ໃນຂະນະທີ່ຄວາມຕ້ອງການຂອງຂໍ້ມູນສໍາລັບການ AI, ໂມເລກທີ centralized ຈະບໍ່ມີ. ອຸປະກອນຂໍ້ມູນເຫຼົ່ານີ້ບໍ່ສາມາດຂະຫນາດໃຫຍ່ໃຫ້ບໍລິການມະນຸດຂອງມະນຸດທີ່ຈໍາເປັນເພື່ອສະຫນັບສະຫນູນຄວາມຕ້ອງການ. ນອກຈາກນີ້, ພວກເຂົາເຈົ້າບໍ່ສາມາດຊອກຫາຜູ້ຊ່ຽວຊານທີ່ຈໍາເປັນເພື່ອຜະລິດຂໍ້ມູນທີ່ມີຄຸນນະພາບສູງເພື່ອປັບປຸງ AI ກັບການຄາດຄະເນຂອງມະນຸດຂອງມະນຸດ.


ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການປິ່ນປົວຄວາມປອດໄພແລະການປິ່ນປົວຄວາມປອດໄພຂອງພວກເຂົາ. ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການປິ່ນປົວຄວາມປອດໄພແລະການປິ່ນປົວຄວາມປອດໄພຂອງພວກເຂົາ. ພວກເຮົາມີຄວາມຊ່ຽວຊານໃນການປິ່ນປົວຄວາມປອດໄພແລະຄວາມປອດໄພຂອງພວກເຂົາ.


ຫຼັງຈາກນັ້ນ, gamification ໃຫ້ແນ່ໃຈວ່າການດາວໂຫລດຂໍ້ມູນແມ່ນງ່າຍ, ປະຫວັດສາດ, ປະທັບໃຈ, ແລະປະໂຫຍດ instantaneous. ມັນແມ່ນການເຊື່ອມຕໍ່ທັງຫມົດຂອງປະເພດເຫຼົ່ານີ້ທີ່ຊ່ວຍໃຫ້ພວກເຮົາມີຄວາມເປັນໄປໄດ້ເປັນຮູບເງົາທີ່ມີຄຸນນະພາບສູງສຸດທີ່ມີຄຸນນະພາບຫຼາຍຂອງຜູ້ເຮັດວຽກ AI ໃນທົ່ວໂລກ, ການຕັດສິນໃຈແລະການຜະລິດຂໍ້ມູນ.



ບົດຄວາມນີ້ໄດ້ຖືກຂຽນພາຍໃຕ້ HackerNoon's Business Blogging Program.

ບົດຄວາມນີ້ໄດ້ຖືກຂຽນພາຍໃຕ້ HackerNoon's Business Blogging Program.

ຊອບແວ Blog Business


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks