가짜 뉴스 탐지.
2523 단어 pythondevopsgithubprogramming
가짜 뉴스는 많은 잘못된 정보로 이어지기 때문에 세계에서 가장 큰 문제 중 하나입니다. 이러한 거짓 뉴스의 대부분은 지역 사회의 정치적, 종교적 신념에 관한 것일 수 있으며 귀하가 거주하는 국가에서 분명히 보았을 것처럼 폭동과 폭력으로 이어질 수 있습니다. 따라서 가짜 뉴스를 탐지하기 위해 우리는 가짜 뉴스 헤드라인 간의 관계를 찾을 수 있으므로 단순히 헤드라인을 관찰하여 특정 정보가 가짜인지 진짜인지 알려주는 기계 학습 모델을 훈련할 수 있습니다.
Python을 사용한 가짜 뉴스 탐지
가짜 뉴스 감지 작업을 위한 내 데이터 세트에는 뉴스 제목, 뉴스 콘텐츠 및 뉴스가 가짜인지 진짜인지를 표시하는 레이블로 알려진 열에 대한 데이터가 있습니다. 따라서 이 데이터 세트를 사용하여 가짜 뉴스 헤드라인과 실제 뉴스 헤드라인 간의 관계를 찾고 대부분의 가짜 뉴스에 어떤 유형의 헤드라인이 있는지 이해할 수 있습니다. 아래는 내 데이터 세트입니다.
데이터 세트
> #we're loading data into our notebook
> import numpy as np
> import pandas as pd
> import matplotlib.pyplot as plt
> import warnings
#importing our data through pandas
#importing our data through pandas
data=pd.read_csv('/content/drive/MyDrive/news.csv')
#we check how our data looks like
data
#we do data analysis and preprocessing
data.describe()
#To check the total number of rows in our data
data.count()
#To check whether our data have missing values
data.isnull().sum()
#we convert label into 1 and 0
data['label'] = data['label'].apply(lambda x: 1 if x == 'REAL' else 0)
#we convert our data from categorigal to numerical
dummies=pd.get_dummies(data[['title','text']])
#we split our data into x and y
x=data.drop('label',axis=1)
y=data['label']
#lets import the model
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
np.random.seed(42)
model=RandomForestClassifier()
x_train,x_test,y_train,y_test=train_test_split(dummies,
y,
test_size=0.2)
model.fit(x_train,y_train)
model.score(x_test,y_test).
Reference
이 문제에 관하여(가짜 뉴스 탐지.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/kamauruth/fake-news-detection-48k2텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)