
We are searching data for your request:
Upon completion, a link will appear to access the found materials.
ਕਲੱਸਟਰ ਵਿਸ਼ਲੇਸ਼ਣ ਇੱਕ ਅੰਕੜਾ ਤਕਨੀਕ ਹੈ ਜੋ ਇਸਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਵਰਤੀ ਜਾਂਦੀ ਹੈ ਕਿ ਕਿਵੇਂ ਵੱਖ ਵੱਖ ਇਕਾਈਆਂ - ਜਿਵੇਂ ਕਿ ਲੋਕ, ਸਮੂਹ, ਜਾਂ ਸੁਸਾਇਟੀਆਂ - ਉਹਨਾਂ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਕਾਰਨ ਇਕੱਠੀਆਂ ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ ਜਿਹੜੀਆਂ ਉਹਨਾਂ ਦੀਆਂ ਸਾਂਝੀਆਂ ਹਨ. ਕਲੱਸਟਰਿੰਗ ਦੇ ਤੌਰ ਤੇ ਵੀ ਜਾਣਿਆ ਜਾਂਦਾ ਹੈ, ਇਹ ਇਕ ਖੋਜੀ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲ ਹੈ ਜਿਸਦਾ ਉਦੇਸ਼ ਵੱਖੋ ਵੱਖਰੀਆਂ ਵਸਤੂਆਂ ਨੂੰ ਸਮੂਹਾਂ ਵਿੱਚ ਇਸ ਤਰਾਂ ਕ੍ਰਮਬੱਧ ਕਰਨਾ ਹੁੰਦਾ ਹੈ ਕਿ ਜਦੋਂ ਉਹ ਇਕੋ ਸਮੂਹ ਨਾਲ ਸਬੰਧਤ ਹੋਣ ਤਾਂ ਉਹਨਾਂ ਦੀ ਸੰਗਤ ਦੀ ਵੱਧ ਤੋਂ ਵੱਧ ਡਿਗਰੀ ਹੁੰਦੀ ਹੈ ਅਤੇ ਜਦੋਂ ਉਹ ਇਕੋ ਸਮੂਹ ਨਾਲ ਸਬੰਧਤ ਨਹੀਂ ਹੁੰਦੇ ਐਸੋਸੀਏਸ਼ਨ ਦੀ ਡਿਗਰੀ ਘੱਟ ਹੈ. ਕੁਝ ਹੋਰ ਅੰਕੜਾਤਮਕ ਤਕਨੀਕਾਂ ਦੇ ਉਲਟ, ਕਲੱਸਟਰ ਵਿਸ਼ਲੇਸ਼ਣ ਦੁਆਰਾ theਾਂਚੇ ਦਾ ਪਰਦਾਫਾਸ਼ ਕਰਨ ਲਈ ਉਨ੍ਹਾਂ ਨੂੰ ਕਿਸੇ ਵਿਆਖਿਆ ਜਾਂ ਵਿਆਖਿਆ ਦੀ ਜ਼ਰੂਰਤ ਨਹੀਂ ਹੁੰਦੀ - ਇਹ ਇਸ ਗੱਲ ਦੀ ਵਿਆਖਿਆ ਕੀਤੇ ਬਗੈਰ ਅੰਕੜਿਆਂ ਵਿਚ structureਾਂਚੇ ਦੀ ਖੋਜ ਕਰਦੀ ਹੈ ਕਿ ਉਹ ਕਿਉਂ ਹਨ.
ਕਲੱਸਟਰਿੰਗ ਕੀ ਹੈ?
ਕਲੱਸਟਰਿੰਗ ਸਾਡੀ ਰੋਜ਼ਾਨਾ ਜ਼ਿੰਦਗੀ ਦੇ ਹਰ ਪਹਿਲੂ ਵਿੱਚ ਮੌਜੂਦ ਹੈ. ਉਦਾਹਰਣ ਵਜੋਂ, ਕਰਿਆਨੇ ਦੀ ਦੁਕਾਨ ਵਿੱਚ ਚੀਜ਼ਾਂ ਲਓ. ਵੱਖੋ ਵੱਖਰੀਆਂ ਕਿਸਮਾਂ ਦੀਆਂ ਚੀਜ਼ਾਂ ਹਮੇਸ਼ਾਂ ਇੱਕੋ ਜਾਂ ਆਸ ਪਾਸ ਦੇ ਸਥਾਨਾਂ ਤੇ ਪ੍ਰਦਰਸ਼ਤ ਹੁੰਦੀਆਂ ਹਨ - ਮੀਟ, ਸਬਜ਼ੀਆਂ, ਸੋਡਾ, ਸੀਰੀਅਲ, ਕਾਗਜ਼ ਉਤਪਾਦ, ਆਦਿ. ਖੋਜਕਰਤਾ ਅਕਸਰ ਡੈਟਾ ਅਤੇ ਸਮੂਹ ਦੀਆਂ ਚੀਜ਼ਾਂ ਜਾਂ ਵਿਸ਼ਿਆਂ ਦੇ ਨਾਲ ਸਮੂਹਾਂ ਵਿੱਚ ਅਜਿਹਾ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹਨ ਜੋ ਅਰਥ ਰੱਖਦੇ ਹਨ.
ਸਮਾਜਿਕ ਵਿਗਿਆਨ ਤੋਂ ਉਦਾਹਰਣ ਲੈਣ ਲਈ, ਮੰਨ ਲਓ ਕਿ ਅਸੀਂ ਦੇਸ਼ਾਂ ਨੂੰ ਵੇਖ ਰਹੇ ਹਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਸਮੂਹਾਂ ਵਿੱਚ ਸਮੂਹ ਬਣਾਉਣਾ ਚਾਹੁੰਦੇ ਹਾਂ ਜਿਵੇਂ ਕਿ ਕਿਰਤ, ਵੰਡ, ਟੈਕਨਾਲੋਜੀ, ਜਾਂ ਪੜ੍ਹੇ-ਲਿਖੇ ਲੋਕਾਂ ਦੀ ਵੰਡ ਵਰਗੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਅਧਾਰ ਤੇ ਸਮੂਹਾਂ ਵਿੱਚ ਸਮੂਹ ਬਣਾਉਣਾ. ਅਸੀਂ ਵੇਖਾਂਗੇ ਕਿ ਬ੍ਰਿਟੇਨ, ਜਾਪਾਨ, ਫਰਾਂਸ, ਜਰਮਨੀ ਅਤੇ ਸੰਯੁਕਤ ਰਾਜ ਅਮਰੀਕਾ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਇਕੋ ਜਿਹੀਆਂ ਹਨ ਅਤੇ ਇਕੱਠੀਆਂ ਹੋਣਗੀਆਂ. ਯੂਗਾਂਡਾ, ਨਿਕਾਰਾਗੁਆ ਅਤੇ ਪਾਕਿਸਤਾਨ ਨੂੰ ਵੀ ਇਕ ਵੱਖਰੇ ਸਮੂਹ ਵਿਚ ਇਕੱਠਿਆਂ ਕੀਤਾ ਜਾਵੇਗਾ ਕਿਉਂਕਿ ਉਹ ਵੱਖੋ ਵੱਖਰੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦੇ ਸਾਂਝੇ ਹੁੰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਦੌਲਤ ਦੇ ਹੇਠਲੇ ਪੱਧਰ, ਮਜ਼ਦੂਰਾਂ ਦੀ ਸਰਲ ਵੰਡ, ਤੁਲਨਾਤਮਕ ਅਸਥਿਰ ਅਤੇ ਲੋਕਤੰਤਰੀ ਰਾਜਨੀਤਿਕ ਸੰਸਥਾਵਾਂ ਅਤੇ ਘੱਟ ਤਕਨੀਕੀ ਵਿਕਾਸ.
ਕਲੱਸਟਰ ਵਿਸ਼ਲੇਸ਼ਣ ਆਮ ਤੌਰ ਤੇ ਖੋਜ ਦੇ ਖੋਜੀ ਪੜਾਅ ਵਿੱਚ ਇਸਤੇਮਾਲ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਖੋਜਕਰਤਾ ਕੋਲ ਪਹਿਲਾਂ ਤੋਂ ਕੋਈ ਧਾਰਣਾ ਨਹੀਂ ਹੈ. ਇਹ ਆਮ ਤੌਰ ਤੇ ਵਰਤਿਆ ਜਾਂਦਾ ਇਕਮਾਤਰ ਅੰਕੜਾ ਹੀ ਨਹੀਂ ਹੁੰਦਾ, ਬਲਕਿ ਬਾਕੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਅਗਵਾਈ ਕਰਨ ਵਿਚ ਸਹਾਇਤਾ ਲਈ ਪ੍ਰੋਜੈਕਟ ਦੇ ਸ਼ੁਰੂਆਤੀ ਪੜਾਅ ਵਿਚ ਕੀਤਾ ਜਾਂਦਾ ਹੈ. ਇਸ ਕਾਰਨ ਕਰਕੇ, ਮਹੱਤਤਾ ਜਾਂਚ ਆਮ ਤੌਰ 'ਤੇ ਨਾ ਤਾਂ relevantੁਕਵੀਂ ਹੁੰਦੀ ਹੈ ਅਤੇ ਨਾ ਹੀ appropriateੁਕਵੀਂ.
ਕਲੱਸਟਰ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀਆਂ ਕਈ ਵੱਖਰੀਆਂ ਕਿਸਮਾਂ ਹਨ. ਦੋ ਸਭ ਤੋਂ ਵੱਧ ਵਰਤੇ ਜਾਂਦੇ ਹਨ ਕੇ-ਮਤਲਬ ਕਲੱਸਟਰਿੰਗ ਅਤੇ ਲੜੀਵਾਰ ਕਲੱਸਟਰਿੰਗ.
ਕੇ-ਮਤਲਬ ਕਲੱਸਟਰਿੰਗ
ਕੇ-ਮਤਲਬ ਕਲੱਸਟਰਿੰਗ ਡੇਟਾ ਵਿਚਲੇ ਨਿਰੀਖਣਾਂ ਨੂੰ ਮੰਨਦੀ ਹੈ ਜਿਵੇਂ ਇਕਾਈਆਂ ਤੋਂ ਸਥਾਨ ਅਤੇ ਦੂਰੀਆਂ ਵਾਲੀਆਂ ਚੀਜ਼ਾਂ (ਨੋਟ ਕਰੋ ਕਿ ਕਲੱਸਟਰਿੰਗ ਵਿਚ ਵਰਤੀਆਂ ਜਾਂਦੀਆਂ ਦੂਰੀ ਅਕਸਰ ਸਥਾਨਿਕ ਦੂਰੀਆਂ ਨਹੀਂ ਦਰਸਾਉਂਦੀਆਂ). ਇਹ ਆਬਜੈਕਟਸ ਨੂੰ ਕੇ ਪਰਸਪਰ ਐਕਸਕਲੂਸਿਵ ਕਲੱਸਟਰਾਂ ਵਿੱਚ ਵੰਡਦਾ ਹੈ ਤਾਂ ਕਿ ਹਰੇਕ ਸਮੂਹ ਦੇ ਅੰਦਰ ਇਕਾਈ ਜਿੰਨੀ ਸੰਭਵ ਹੋ ਸਕੇ ਇਕ ਦੂਜੇ ਦੇ ਨਜ਼ਦੀਕ ਹੋਵੇ ਅਤੇ ਉਸੇ ਸਮੇਂ, ਜਿੰਨਾ ਸੰਭਵ ਹੋ ਸਕੇ ਦੂਸਰੇ ਕਲੱਸਟਰਾਂ ਵਿਚਲੇ ਇਕਾਈਆਂ ਤੋਂ. ਹਰ ਕਲੱਸਟਰ ਨੂੰ ਫਿਰ ਇਸਦੇ ਮਤਲਬ ਜਾਂ ਕੇਂਦਰ ਬਿੰਦੂ ਦੁਆਰਾ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ.
Hierarchical ਕਲੱਸਟਰਿੰਗ
ਹਾਇਰਾਰਕਿਕਲ ਕਲੱਸਟਰਿੰਗ ਡੇਟਾ ਵਿਚ ਸਮੂਹਾਂ ਦੀ ਇਕੋ ਸਮੇਂ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਸਕੇਲ ਅਤੇ ਦੂਰੀਆਂ ਦੀ ਜਾਂਚ ਕਰਨ ਦਾ ਇਕ ਤਰੀਕਾ ਹੈ. ਇਹ ਵੱਖ ਵੱਖ ਪੱਧਰਾਂ ਦੇ ਨਾਲ ਇੱਕ ਕਲੱਸਟਰ ਟ੍ਰੀ ਬਣਾ ਕੇ ਕਰਦਾ ਹੈ. ਕੇ-ਮਤਲਬ ਕਲੱਸਟਰਿੰਗ ਤੋਂ ਉਲਟ, ਰੁੱਖ ਇਕ ਸਮੂਹ ਦਾ ਸਮੂਹ ਨਹੀਂ ਹੁੰਦਾ. ਇਸ ਦੀ ਬਜਾਏ, ਰੁੱਖ ਇਕ ਬਹੁ-ਪੱਧਰੀ ਲੜੀ ਹੈ ਜਿੱਥੇ ਇਕ ਪੱਧਰ 'ਤੇ ਸਮੂਹ ਅਗਲੇ ਸਮੂਹ ਦੇ ਉੱਚ ਸਮੂਹ' ਤੇ ਸਮੂਹ ਦੇ ਤੌਰ 'ਤੇ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ. ਐਲਗੋਰਿਦਮ ਜੋ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ ਉਹ ਹਰੇਕ ਕੇਸ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ ਜਾਂ ਇੱਕ ਵੱਖਰੇ ਸਮੂਹ ਵਿੱਚ ਪਰਿਵਰਤਨਸ਼ੀਲ ਹੁੰਦਾ ਹੈ ਅਤੇ ਫਿਰ ਕਲੱਸਟਰਾਂ ਨੂੰ ਜੋੜਦਾ ਹੈ ਜਦੋਂ ਤੱਕ ਸਿਰਫ ਇੱਕ ਹੀ ਨਹੀਂ ਬਚਦਾ. ਇਹ ਖੋਜਕਰਤਾ ਨੂੰ ਇਹ ਫੈਸਲਾ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਕਿ ਉਸਦੀ ਖੋਜ ਲਈ ਕਲੱਸਟਰਿੰਗ ਦਾ ਕਿਹੜਾ ਪੱਧਰ ਸਭ ਤੋਂ appropriateੁਕਵਾਂ ਹੈ.
ਇੱਕ ਕਲੱਸਟਰ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨਾ
ਬਹੁਤੇ ਅੰਕੜੇ ਸਾੱਫਟਵੇਅਰ ਪ੍ਰੋਗਰਾਮ ਕਲੱਸਟਰ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਸਕਦੇ ਹਨ. ਐਸਪੀਐਸ ਵਿੱਚ, ਦੀ ਚੋਣ ਕਰੋ ਵਿਸ਼ਲੇਸ਼ਣ ਮੀਨੂੰ ਤੋਂ, ਫਿਰ ਸ਼੍ਰੇਣੀਬੱਧ ਅਤੇ ਕਲੱਸਟਰ ਵਿਸ਼ਲੇਸ਼ਣ. ਐਸ ਏ ਐਸ ਵਿਚ, ਸ ਪ੍ਰੋਸ ਕਲੱਸਟਰ ਫੰਕਸ਼ਨ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ.
ਨਿੱਕੀ ਲੀਜ਼ਾ ਕੋਲ ਦੁਆਰਾ ਅਪਡੇਟ ਕੀਤਾ ਗਿਆ, ਪੀਐਚ.ਡੀ.