일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Recipe
- 쳇지피티
- 웨크롤링
- Llama
- 웹크롤링
- temurin
- chatGPT
- Windows
- java17
- bs4
- 오블완
- 포트포워딩
- AI
- WSL
- PROJECT
- brew
- 파인튜닝
- 레시피
- OpenAI
- DALL-E
- Java
- Python
- JSON
- web crowling
- LLM
- API
- ssh
- 티스토리챌린지
- jdk
- Linux
- Today
- Total
목록Python (11)
Nacho
주제: 인공위성 데이터로 도시 환경 개선 도메인 이해. Cool Roof 건물지붕이나 옥상에 태양열 차단 효과가 있는 차열 페인트를 칠하여 건물에 열기가 축적되는 것을 줄이는 공법 Cool Roof 사업 지원대상 선정을 위해 1차적으로 지원대상을 식별하는 방법 도출 인공위성 영상 데이터를 이용하여 Cool Roof, Generic Roof 분류 Datasets 임의의 위성 영상 데이터 200장(.jpg) annotate 된 .txt 파일 200개 roboflow에서 annotate 및 증강데이터 885개 https://universe.roboflow.com/project-u6acg/test-ohxb9 Cool Roof 사업의 선정대상을 분류하는 문제이다. 따라서 Cool Roof : 0, Generic ..
멜론차트를 데이터프레임으로 만들어보자..! 우선 라이브러리를 불어온다. import pandas as pd import requests from bs4 import BeautifulSoup pandas : 데이터를 데이터프레임으로 만든다. requests : 파이썬에서 명령어로 서버에 요청을 보내는 역할 BeautifulSoup : requsts 로 받아온 html의 parsing을 위한 라이브러리 Melon Top 100 사이트는 서버에 json 형태의 데이터를 요청하여 정보를 업데이트하는 동적사이트가 아닌, html을 다시 받아오는 정적사이트 형태이다. 따라서, BeautifulSoup을 이용하여 원하는 데이터를 parsing 해줄 것이다. 멜론 차트 TOP 100 개발자도구 network 탭에서 h..
빅분기 시절 공부 했던 이론을 다시 꺼내어 정리해 봤다. ( Feature, x ) : 범주 이고, (Target, y ) : 연속 일 때, T-test, ANOVA, Wilcoxon, 등등.. 정리가 안돼서 머리 아픈 청춘을 위해하여... 정규성 검사 import spicy.stats as stats statistic, pvalue = stats.shapiro(df['column']) 단일 표본 t 검정 statistic, p_value = stats.ttest_1samp(df['column'], popmean= mean, alternative='greater or less or two-sided') 윌콕슨 부호순위 검정 statistic, pvalue = stats.wilcoxon(df['colums..
예제로 이해해 보자. 목표 주사위의 표본을 달리하여 표본 평균을 구하고 모평균과 비교해 보자. 표본 평균이 정규부포를 따르는지 확인해 보자. 우선 우리가 알고 싶은 것이 무엇인지 정확히 이해해야 한다. 💡 우리의 목표 : 직접 주사위 30000개를 굴려서 평균을 구할 수 없기 때문에 주사위를 조금만 굴려서 대충 신뢰할만한 표본의 평균값을 구하고 싶은 것이다. 하지만, 우선 답은 알아야 문제를 잘 풀었는지 알 수 있으니 모평균(모집단의 평균 = 30000개의 주사위 값 평균)을 구해보자. import random dices_30000 = [random.randrange(1,7) for _ in range(30000)] print(round(sum(dices_30000)/30000,3)) # Output: ..
자. 데이터프레임을 주물러보자. pd.concat() axis 값을 통해 결합 방향을 설정한다. join을 사용하여 결합 방식을 설정한다. 🔍 두 DataFrame을 사용하여 결합 방식을 살펴보자. axis = 0, 행으로 결합 (세로 방향), 우선 세로 방향으로 데이터가 추가하자. 공통되는 열을 기준으로 표를 재배치해본다면 다음과 같다. 표가 생긴게 이상하지만 중간 과정이라고 생각하면 이해가 쉬워진다 join = 'inner' 공통된 열만 합치기. join = 'outer' 모든 열 합치기. 남은 빈칸을 결측치로 채워 반환한다. axis = 1, 열로 결합 (가로 방향), 우선 가로 방향으로 데이터를 추가하자. 공통되는 행을 기준으로 표를 재배치해본다면 다음과 같다. 표가 생긴게 이상하다. 맞다. jo..
자 pandas 를 복습해보자.(2) 공부한 내용을 다 적어 올리고 싶은데 데이터프레임 옮겨오는 게 쉬운 일이 아니다.. # 라이브러리 불러오기 import pandas as pd # 시작은 언제나 아묻따 import 갈겨버리깅 pd.DataFrame.groupby() 데이터프레임을 다루면서 가장 헷갈리는 부분이 아닐까 싶다. 빅분기 1과목 공부하면서 가장 나를 힘들게 했던 녀석... pandas 공식문서에 따르면 pd.DataFrame.groupby() 와 pd.Series.groupby()가 나뉘어 있다. https://pandas.pydata.org/docs/reference/groupby.html 자세한 건 여기로... # 데이터 읽어오기 df = pd.read_csv('https://raw.g..