기술통계학(10)
-
"어디가 더 잘 맞을까?, '지역+업종분석' VS '발주처+업종분석' AI에게 물어보니 답은 정해져 있었습니다
제미나이 AI ->나라장터 전자입찰 데이터 분석에서 '지역+업종' 조합과 '발주처+업종' 조합 중 어느 것이 통계학적으로 유리한지는 '표본의 크기(Sample Size)'와 '모집단의 동질성(Homogeneity)' 사이의 절충안(Trade-off)을 어떻게 설계하느냐에 달려 있습니다.질문하신 상황을 통계학적 관점에서 분석한 결과는 다음과 같습니다. 1. 통계적 신뢰도와 표본 크기 (Law of Large Numbers)통계학에서 표본의 수가 적으면 표준 오차(Standard Error)가 커집니다. 사정률 데이터가 정규분포를 따른다고 가정할 때, 데이터의 수가 부족하면 특정 소수 업체나 우연한 사건에 의해 평균값이 왜곡되는 '노이즈' 현상이 강해집니다.지역+업종 분석: 모집단이 균질하고 데이터 수가 충..
2026.05.13 -
"입찰 컨설팅 시장에서 '경쟁사 밀착 분석'이라는 용어가 마케팅적 수사에 불과한지, 아니면 실제 데이터 과학 측면에서 근거가 있는 것인지 비판적으로 검토해줘.
제미나이 AI ->1. 경쟁률 1/700 이상: '통계적 노이즈'의 영역말씀하신 대로 경쟁률이 극도로 높은(700:1 이상) 공고는 사실상 개별 업체의 의지보다 '군집(Swarm)'의 움직임이 지배합니다.가변성의 증폭: 수백 개의 업체가 각기 다른 전략(혹은 무작위 투찰)을 가지고 들어올 때, 특정 업체의 과거 데이터를 추적하는 것은 전체 결과값에 영향을 미치지 못하는 '노이즈'가 될 가능성이 큽니다.불확정성 전이: 개별 경쟁사 분석에 가중치를 두면, 오히려 정교하게 설계된 확률 모델(정규분포나 마르코프 연쇄 등)의 객관성을 오염시킬 위험이 있습니다. 이 경우 확률적 예측의 신뢰도만 떨어뜨리는 결과가 초래될 수 있습니다. 2. 고경쟁 공고에서의 전략: '개별'에서 '군집'으로경쟁률이 높은 공고에서는 '누..
2026.05.13 -
표준오차-Standard Error
표준 오차는 통계적 추정치의 불확실성을 나타내며, 주로 표본 평균이나 추정치의 변동성에 대한 추정치를 제공합니다. 표준 오차의 개념을 시각적으로 나타낸 이미지는 통계학을 공부하거나 데이터를 분석할 때 유용하게 사용될 수 있습니다. 이러한 이미지는 표본 평균의 분포와 모평균과의 관계를 이해하는 데 도움을 줄 수 있습니다. 표준 오차가 작을수록 표본 평균들이 모평균에 더 가까이 모여 있음을 나타내며, 이는 추정치의 정확도가 높음을 의미합니다. 표준 오차(Standard Error, SE)는 통계에서 사용되는 개념으로, 표본 평균의 변동성을 측정하는 데 사용됩니다. 표본 평균의 표준 오차(SEM, Standard Error of the Mean)는 표본 평균 분포의 표준 편차를 의미하며, 이는 표본 평균이 모..
2024.03.19 -
신뢰도-Reliability
신뢰도(reliability)는 측정 도구가 일관되고 정확한 결과를 제공하는 정도를 나타내는 통계학적 개념입니다. 신뢰도가 높은 측정 도구는 반복적으로 같은 조건에서 동일한 대상을 측정할 때 일관된 결과를 가져옵니다. 신뢰도는 0과 1 사이의 값으로 표현되며, 0은 결과가 전적으로 무작위 오차로 구성되어 있음을, 1은 오차가 전혀 없는 왑벽한 신뢰성을 의미합니다. 기술통계학에서의 신뢰도는 측정 도구가 일관되고 정확한 결과를 제공하는 정도를 나타냅니다. 신뢰도가 높다는 것은 해당 도구가 반복적으로 같은 조건에서 동일한 대상을 측정할 때 일관된 결과를 가져온다는 의미입니다. 신뢰도는 다음과 같은 방법으로 측정될 수 있습니다. 재검사 신뢰도: 같은 측정 도구를 사용하여 시간 간격을 두고 동일한 대상을 두 번 ..
2024.03.19 -
기술통계를 활용한 나라장터 시그마 분석법
1. 예가사정률은 '평균'으로 회귀합니다 🔄나라장터 예가사정률은 시계열로 분석했을 때 표준정규분포 밀도함수를 따릅니다.어려운 용어 같지만 원리는 간단합니다. 사정률은 평균을 중심으로 **좌(Minus/Down)**와 **우(Plus/Up)**로 진동하며, 진폭이 크든 작든 결국은 다시 평균으로 수렴하려는 성질을 가지고 있습니다.💡 핵심 포인트사정률은 무작위로 튀는 것 같아도, 결국 통계적인 '평균의 힘'에 이끌려 돌아오게 되어 있습니다. 2. 시그마(sigma)로 보는 낙찰 확률 구간 🎯통계학에서는 데이터가 분포하는 범위를 **'표준편차(시그마)'**라는 단위로 설명합니다. 비드파일럿 차트를 해석할 때 이 세 가지만 기억하세요!✅ ±1시그마 구간: "데이터의 황금 구역" (68.27%)분포 확률: ..
2024.03.11 -
기술통계학 - Descriptive analsys
기초적인 기술통계분석으로는 평균,표준편차등과 같은 수치나 산점도,막대그래프 같은 그래픽적 표현이 있다. 그러나 이러한 기초적인 기술통계분석은 추론통계(inference statistics)같은 복잡한 통계 분석에서뿐만아니라 빈도분석(frequency analysis), 기술분석(descriptive analysis), 상관분석(reliability analysis)등에서 기본이 된다. 나라장터 예가 데이터는 시계열 1차원 데이터로 평균, 표준편차, 분산을 활용 엑셀 NORN.DST로 분산형 그래프로 산출하면 표준정규분포밀도함수에 적합하다.기술통계법은 빈도분석, 기술분석, 다중분석의 세가지 유형으로 나눠집니다.대부분의 사정률 산출 프로그램은 빈도분석에 한하여 개발되 사용되고 있습니다.이번에 출시된 초격차 ..
2024.03.08