Python으로 가짜 뉴스 탐지

2280 단어

가짜 뉴스는 온라인 소셜 플랫폼의 가장 큰 문제 중 하나입니다. 가짜 뉴스 감지를 위해 기계 학습을 사용할 수 있습니다. 이 기사에서는 Python을 사용하는 기계 학습으로 가짜 뉴스 탐지 작업을 안내합니다. 기본 워크플로우는 다음과 같습니다.

#we're loading data into our notebook
#we load in the necessary libraries
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import warnings
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB

관련 라이브러리를 가져온 후 d에 로드해야 합니다.

#importing our data through pandas
data=pd.read_csv('/content/drive/MyDrive/news.csv')

데이터를 로드한 후 살펴보겠습니다. 데이터를 먼저 이해하지 않고 모든 데이터를 예측 모델에 넣는 것은 일반적으로 권장되지 않습니다. 이는 종종 모델을 개선하는 데 도움이 됩니다.

#we check our first five rows and columns
data.head()

누락된 데이터 값은 모델을 망칠 수 있습니다. 누락된 데이터가 있는지 확인하고 채우는 것이 중요합니다. 우리의 경우 누락된 값이 없었습니다.

#To check whether our data have missing values
data.isnull().sum()

기계 학습 알고리즘은 텍스트(카테고리 값)를 이해할 수 없으므로 숫자 데이터로 변환해야 합니다.

람다 함수를 사용하여 '레이블'을 1과 0으로 변환합니다.

data['label'] = data['label'].apply(lambda x: 1 if x == 'REAL' else 0)

다른 범주 기능의 경우 pandas 라이브러리의 함수 더미를 사용합니다.

dummies=pd.get_dummies(data[['title','text']])

그런 다음 데이터를 x 및 y 변수로 분할합니다.

#we split our data into x and y
x=data.drop('label',axis=1)
y=data['label']

마지막으로 RandomForestClassifier를 사용하여 모델을 맞출 것입니다.

from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import train_test_split

np.random.seed(42)
x_train,x_test,y_train,y_test=train_test_split(dummies,y,test_size=0.2)
model=MultinomialNB()
model.fit(x_train,y_train)
model.score(x_test,y_test)

이것이 Python 프로그래밍 언어를 사용하여 가짜 뉴스 탐지 작업을 위한 기계 학습 모델을 훈련하는 방법입니다. Python을 사용한 기계 학습으로 가짜 뉴스 탐지 작업에 대한 이 기사가 마음에 들었기를 바랍니다.

Reference

이 문제에 관하여(Python으로 가짜 뉴스 탐지), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/dbriane208/fake-news-detection-with-python-lp5

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다