Regression analysis in Microsoft Excel

ການວິເຄາະຄວາມຖີ່ແມ່ນເປັນວິທີການຫນຶ່ງທີ່ສໍາຄັນທີ່ສຸດໃນການຄົ້ນຄວ້າທາງສະຖິຕິ. ດ້ວຍມັນ, ທ່ານສາມາດກໍານົດລະດັບຂອງອິດທິພົນຂອງຕົວແປອິສະລະໃນຕົວແປທີ່ຂຶ້ນກັບ. Microsoft Excel ມີເຄື່ອງມືສໍາລັບປະຕິບັດປະເພດຂອງການວິເຄາະນີ້. ໃຫ້ເບິ່ງສິ່ງທີ່ພວກເຂົາເປັນແລະວິທີການນໍາໃຊ້ພວກມັນ.

Package Analysis Connection

ແຕ່ວ່າ, ເພື່ອນໍາໃຊ້ຫນ້າທີ່ທີ່ອະນຸຍາດໃຫ້ສໍາລັບການວິເຄາະການກະຕຸ້ນ, ກ່ອນອື່ນ, ທ່ານຈໍາເປັນຕ້ອງໃຊ້ໂປແກຼມ Package. ພຽງແຕ່ຫຼັງຈາກນັ້ນເຄື່ອງມືທີ່ຈໍາເປັນສໍາລັບຂັ້ນຕອນນີ້ຈະປາກົດຢູ່ໃນແຜ່ນ Excel.

  1. ຍ້າຍໄປທີ່ແຖບ "ໄຟລ໌".
  2. ໄປຫາພາກ "ຕົວເລືອກ".
  3. ປ່ອງຢ້ຽມຕົວເລືອກ Excel ເປີດ. ໄປຫາພາກ Add-ons.
  4. ຢູ່ດ້ານລຸ່ມຂອງປ່ອງຢ້ຽມທີ່ເປີດ, ຈັດການສະຫວິດໃນບລັອກ "ການຄຸ້ມຄອງ" ໃນຕໍາແຫນ່ງ Excel Add-insຖ້າມັນຢູ່ໃນຕໍາແຫນ່ງທີ່ແຕກຕ່າງກັນ. ພວກເຮົາກົດປຸ່ມ "ໄປ".
  5. ຫນ້າຕ່າງ Excel ເພີ່ມເຕີມເປີດ. ໃສ່ເຄື່ອງຫມາຍຢູ່ໃກ້ກັບລາຍການ "ແພັກເກດການວິເຄາະ"ທີ່ຢູ່ ກົດປຸ່ມ "OK".

ໃນປັດຈຸບັນໃນເວລາທີ່ພວກເຮົາໄປແຖບ "ຂໍ້ມູນ", ໃນ tape ໃນຕັນຂອງເຄື່ອງມື "ການວິເຄາະ" ພວກເຮົາຈະເຫັນປຸ່ມໃຫມ່ - "ການວິເຄາະຂໍ້ມູນ".

ປະເພດຂອງການວິເຄາະການກະຕຸ້ນ

ມີຫຼາຍປະເພດຂອງການກະຕຸ້ນ:

  • parabolic
  • ພະລັງງານ
  • logarithmic
  • exponential
  • indicative
  • hyperbolic
  • linear regression

ພວກເຮົາຈະສົນທະນາເພີ່ມເຕີມກ່ຽວກັບການປະຕິບັດການປະເມີນເບື້ອງລຸ່ມຂອງການວິເຄາະການກະຕຸ້ນໃນ Excel.

Linear regression in Excel

ຂ້າງລຸ່ມນີ້ເປັນຕາຕະລາງທີ່ສະແດງໃຫ້ເຫັນເຖິງອຸນຫະພູມອາກາດໃນແຕ່ລະອາທິດໂດຍສະເລ່ຍແລະຈໍານວນຜູ້ຊື້ໃນຮ້ານທີ່ມີມື້ເຮັດວຽກທີ່ສອດຄ້ອງກັນ. ໃຫ້ຊອກຫາດ້ວຍການຊ່ວຍເຫຼືອຂອງການວິເຄາະການກະຕຸ້ນ, ສະພາບອາກາດທີ່ແນ່ນອນໃນຮູບແບບຂອງອຸນຫະພູມອາກາດສາມາດມີຜົນກະທົບການເຂົ້າຮ່ວມຂອງການສ້າງຕັ້ງການຄ້າ.

ສົມຜົນ regression ທົ່ວໄປຂອງປະເພດເສັ້ນຄືດັ່ງຕໍ່ໄປນີ້:Y = a0 + a1x1 + + akhkທີ່ຢູ່ ໃນສູດນີ້ Y ຫມາຍຄວາມວ່າຕົວແປ, ອິດທິພົນຂອງປັດໃຈທີ່ພວກເຮົາກໍາລັງພະຍາຍາມສຶກສາ. ໃນກໍລະນີຂອງພວກເຮົາ, ນີ້ແມ່ນຈໍານວນຜູ້ຊື້. ຫມາຍຄວາມວ່າ x - ເຫຼົ່ານີ້ແມ່ນປັດໄຈຕ່າງໆທີ່ມີຜົນກະທົບຕໍ່ຕົວປ່ຽນແປງ. Parameters a ແມ່ນຕົວຄູນ regression. ນັ້ນແມ່ນ, ພວກເຂົາກໍານົດຄວາມສໍາຄັນຂອງປັດໃຈໂດຍສະເພາະ. ດັດນີ k ຫມາຍເຖິງຈໍານວນທັງຫມົດຂອງປັດໃຈຫຼາຍເຫຼົ່ານີ້.

  1. ກົດປຸ່ມ "ການວິເຄາະຂໍ້ມູນ"ທີ່ຢູ່ ມັນຖືກຈັດໃສ່ໃນແຖບ. "ບ້ານ" ໃນຕັນຂອງເຄື່ອງມື "ການວິເຄາະ".
  2. ປ່ອງຢ້ຽມຂະຫນາດນ້ອຍເປີດ. ໃນນັ້ນ, ເລືອກເອົາລາຍການ "Regression"ທີ່ຢູ່ ພວກເຮົາກົດປຸ່ມ "OK".
  3. ປ່ອງຢ້ຽມປັບຄ່າ regression ເປີດ. ໃນນັ້ນ, ທົ່ງທີ່ຕ້ອງການແມ່ນ "ໄລຍະເວລາຂໍ້ມູນເຂົ້າ" ແລະ "ໄລຍະເວລາເຂົ້າ"ທີ່ຢູ່ ການຕັ້ງຄ່າອື່ນໆທັງຫມົດສາມາດໄວ້ເປັນຄ່າເລີ່ມຕົ້ນ.

    ໃນພາກສະຫນາມ "ໄລຍະເວລາຂໍ້ມູນເຂົ້າ" ພວກເຮົາກໍານົດທີ່ຢູ່ຂອງລະດັບຂອງຈຸລັງທີ່ມີຂໍ້ມູນທີ່ຕັ້ງຢູ່, ອິດທິພົນຂອງປັດໃຈຕ່າງໆທີ່ພວກເຮົາກໍາລັງພະຍາຍາມສ້າງ. ໃນກໍລະນີຂອງພວກເຮົາ, ເຫຼົ່ານີ້ຈະເປັນຈຸລັງໃນຖັນ "ຈໍານວນຜູ້ຊື້". ທີ່ຢູ່ສາມາດເຂົ້າມາດ້ວຍມືໄດ້ຈາກແປ້ນພິມ, ຫຼືທ່ານສາມາດເລືອກເອົາຖັນທີ່ຕ້ອງການ. ທາງເລືອກສຸດທ້າຍແມ່ນງ່າຍດາຍຫຼາຍແລະສະດວກສະບາຍຫຼາຍ.

    ໃນພາກສະຫນາມ "ໄລຍະເວລາເຂົ້າ" ໃສ່ທີ່ຢູ່ຂອງລະດັບຂອງຈຸລັງທີ່ຂໍ້ມູນຂອງປັດໄຈ, ອິດທິພົນຂອງການທີ່ພວກເຮົາຕ້ອງການທີ່ຕັ້ງ, ຕັ້ງຢູ່. ດັ່ງທີ່ໄດ້ກ່າວມາຂ້າງເທິງ, ພວກເຮົາຈໍາເປັນຕ້ອງໄດ້ກໍານົດຜົນກະທົບຂອງອຸນຫະພູມໃນຈໍານວນລູກຄ້າໃນຮ້ານ, ແລະເພາະສະນັ້ນຈຶ່ງໃສ່ທີ່ຢູ່ຂອງເຊນໃນຄໍລໍາ "ອຸນຫະພູມ". ນີ້ສາມາດເຮັດໄດ້ໃນທາງດຽວກັນກັບໃນ "ຈໍານວນຜູ້ຊື້" ພາກສະຫນາມ.

    ດ້ວຍການຊ່ວຍເຫຼືອຂອງການຕັ້ງຄ່າອື່ນໆ, ທ່ານສາມາດກໍານົດປ້າຍຊື່, ລະດັບຄວາມຫນ້າເຊື່ອຖື, ຄົງທີ່ - ສູນ, ສະແດງກາຟຄວາມສົມເຫດສົມຜົນປົກກະຕິແລະປະຕິບັດການປະຕິບັດອື່ນໆ. ແຕ່ໃນກໍລະນີຫຼາຍທີ່ສຸດ, ການຕັ້ງຄ່າເຫຼົ່ານີ້ບໍ່ຈໍາເປັນຕ້ອງມີການປ່ຽນແປງ. ສິ່ງດຽວທີ່ທ່ານຄວນເອົາໃຈໃສ່ແມ່ນຕົວກໍານົດການຜະລິດ. ໂດຍຕົວຢ່າງ, ຜົນໄດ້ຮັບການວິເຄາະແມ່ນຜົນຜະລິດໃນເອກະສານອື່ນ, ແຕ່ໂດຍການປັບປ່ຽນສະຫຼັບ, ທ່ານສາມາດກໍານົດຜົນຜະລິດໃນລະດັບທີ່ກໍານົດໄວ້ໃນເອກະສານທີ່ມີຕາຕະລາງທີ່ມີຂໍ້ມູນຕົ້ນສະບັບ, ຫຼືຢູ່ໃນປຶ້ມແຍກກັນ, ທີ່ຢູ່ໃນໄຟລ໌ໃຫມ່.

    ຫຼັງຈາກການຕັ້ງຄ່າທັງຫມົດຖືກກໍານົດ, ໃຫ້ຄລິກໃສ່ປຸ່ມ. "OK".

ການວິເຄາະຜົນການວິເຄາະ

ຜົນໄດ້ຮັບຂອງການວິເຄາະການກະຕຸ້ນແມ່ນສະແດງຢູ່ໃນຮູບແບບຂອງຕາຕະລາງທີ່ຢູ່ໃນສະຖານທີ່ທີ່ສະແດງໄວ້ໃນການຕັ້ງຄ່າ.

ຫນຶ່ງໃນຕົວຊີ້ວັດຕົ້ນຕໍແມ່ນ R-squaredທີ່ຢູ່ ມັນສະແດງເຖິງຄຸນນະພາບຂອງຮູບແບບ. ໃນກໍລະນີຂອງພວກເຮົາ, ອັດຕາສ່ວນນີ້ແມ່ນ 0,705, ຫຼືປະມານ 70,5%. ນີ້ແມ່ນລະດັບທີ່ມີຄຸນນະພາບທີ່ຍອມຮັບໄດ້. ຄວາມເຂັ້ມແຂງຫນ້ອຍກວ່າ 0.5 ແມ່ນບໍ່ດີ.

ຕົວຊີ້ວັດທີ່ສໍາຄັນອີກອັນຫນຶ່ງແມ່ນຕັ້ງຢູ່ໃນຫ້ອງທີ່ຢູ່ທາງຕັດຂອງເສັ້ນ. "ເສັ້ນທາງ Y" ແລະຄໍລໍາ Oddsທີ່ຢູ່ ມັນສະແດງເຖິງມູນຄ່າທີ່ຈະຢູ່ໃນ Y ແລະໃນກໍລະນີຂອງພວກເຮົາ, ນີ້ແມ່ນຈໍານວນຜູ້ຊື້ທີ່ມີປັດໄຈອື່ນໆທັງຫມົດເທົ່າກັບ 0. ໃນຕາຕະລາງນີ້, ມູນຄ່ານີ້ແມ່ນ 58.04.

ມູນຄ່າຢູ່ທີ່ຈຸດຕັດຂອງຮູບ "Variable X1" ແລະ Odds ສະແດງໃຫ້ເຫັນເຖິງລະດັບຂອງຄວາມຂັດແຍ້ງຂອງ Y ໃນ X. ໃນກໍລະນີຂອງພວກເຮົາ, ນີ້ແມ່ນລະດັບຂອງການຂຶ້ນກັບຈໍານວນລູກຄ້າຂອງຮ້ານໃນອຸນຫະພູມ. ຕົວຊີ້ວັດຂອງ 131 ແມ່ນຖືວ່າເປັນຕົວຊີ້ວັດທີ່ມີອິດທິພົນສູງ.

ຕາມທີ່ທ່ານສາມາດເບິ່ງ, ການໃຊ້ Microsoft Excel ແມ່ນງ່າຍດາຍທີ່ຈະສ້າງຕາຕະລາງການວິເຄາະການກະຕຸ້ນ. ແຕ່ມີພຽງຄົນທີ່ມີການຝຶກອົບຮົມເທົ່ານັ້ນທີ່ສາມາດເຮັດວຽກຮ່ວມກັບຂໍ້ມູນຜົນໄດ້ຮັບແລະເຂົ້າໃຈເຖິງຄວາມສໍາຄັນຂອງມັນ.