Segmentation Fault오류(python3, Ubuntu17.10)
글쓴이: 김덕준@Google / 작성시간: 목, 2018/06/28 - 9:26오전
윈도우즈에서 실행시에 잘되는데 우분투에서 실행시에 segmentaion 오류가 발생하면서 그냥 죽습니다....
리눅스 메모리 문제인지 뭔지 제가 아직 잘 몰라서...
어떻게 해결하면 좋을지 조언 부탁 드립니다
# -*- coding: utf-8 -*- from konlpy.tag import Kkma from konlpy.tag import Twitter from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.feature_extraction.text import CountVectorizer from sklearn.preprocessing import normalize import numpy as np from scipy import sparse class SentenceTokenizer(object): def __init__(self): self.kkma = Kkma() self.twitter = Twitter() self.stopwords = ['조선','중인' ,'만큼', '마찬가지', '꼬집었', "연합뉴스", "데일리", "동아일보", "중앙일보", "조선일보", "기자","아", "휴", "아이구", "아이쿠", "아이고", "어", "나", "우리", "저희", "따라", "의해", "을", "를", "에", "의", "가",] def url2sentences(self ): test = '신용카드 사용액이 소득공제를 받을 수 있는 요건에 못 미치니까 아예 사용액을 신고하지 않았던 겁니다. 김상조 공정거래위원장 후보자가 인사검증 과정에서 신용카드 사용액을 밝히지 않은 이유를 이렇게 설명했다. 김 후보자는 카드 사용액이 총소득의 4분의 1을 넘어야 하는 소득공제 요건을 충족하지 못한 것이다. 월급쟁이라면 응당 카드 소득공제를 받는 것으로 생각하지만 김 후보자처럼 공제를 포기하거나 받지 못하는 사람들도 적지 않다. 게다가 고소득자를 중심으로 올해부터 카드 소득공제 혜택을 줄일 예정이라 카드 공제받기가 더 까다로워진다. 11일 국세통계연보에 따르면, 2015년 기준으로 1733만명인 근로소득자 중에서 카드 소득공제를 받은 사람은 49.4%인 856만명으로 절반에 못 미쳤다. 그중 소득세가 면세(免稅)돼 세금을 내지 않은 257만명을 제외하고 실제로 세금을 낸 사람 중에서 카드 소득공제를 받은 사람은 599만명으로 전체 월급쟁이의 34.5%였다. ◇연봉 5000만원대가 84%로 카드 공제 가장 많이 받아 신용카드 소득공제를 받으려면 총소득의 4분의 1 이상을 카드로 써야 한다. 4분의 1 문턱에서 1원이라도 모자라면 한 푼도 공제받을 수 없다. 수억원대의 고소득자일수록 카드로 소득의 4분의 1 이상을 쓰기 쉽지 않기 때문에 소득이 높을수록 공제를 못 받는 경우가 늘어난다. 2015년 기준으로 근로소득세를 내는 사람 중에서 카드 소득공제를 받는 비율이 가장 많은 소득 구간은 연봉 5000만~6000만원이었다. 전체의 84%가 혜택을 봤다. 연봉 6000만~8000만원 사이에서도 83%, 8000만~1억원 구간은 79%가 공제를 받았다. 반면 1억~2억원 사이에서는 공제받은 사람 비율이 68%로 줄었고, 2억~3억원인 사람은 31%만 카드 공제를 받은 것으로 나타났다. 국세청 관계자는 “월급쟁이가 카드를 쓰는 용도가 다들 엇비슷해서 고소득자라고 해서 카드 사용액이 월등하게 늘어나지는 않기 때문에 소득이 높을수록 ‘4분의 1 문턱’을 넘기가 어려워지는 경향이 있다”고 말했다. 또 고소득자들이 외국에 나가 카드를 많이 사용하지만, 해외에서의 카드 사용액을 일절 공제해주지 않는 점도 영향이 있는 것으로 분석된다. ◇소득 낮은 부부는 한 사람 명의의 카드 써야 유리 소득이 연 5000만원에 못 미치는 서민층에서도 카드 공제를 받는 사람들의 비율이 낮아지는 경향을 보인다. 연봉 4000만원대는 81%, 3000만원대는 73%, 2000만원대는 55%만 카드 소득공제를 받은 것으로 나타났다. 이런 현상이 나타나는 이유는 우선 저소득층일수록 허리띠를 졸라매는 경향이 있어 ‘4분의 1 문턱’을 넘지 못하는 경우가 상당하기 때문인 것으로 추정된다. 또 소득이 넉넉하지 않은 맞벌이의 경우 한 사람 명의로 카드를 발급받아 한 사람의 카드 사용액이 ‘4분의 1 문턱’을 넘도록 몰아주고, 나머지 배우자는 카드 소득공제를 포기하는 절세 노하우를 보여주는 사례도 많다고 국세청 관계자들은 설명했다. 서울지역의 한 세무사는 “부부가 각자 명의로 카드를 쓰다가 둘 다 ‘4분의 1 문턱’을 못 넘겨 안 내도 될 세금을 더 내는 경우가 있으니 주의해야 한다”고 말했다. 2015년 기준으로 카드 소득공제를 받은 599만명은 평균 245만원을 공제받은 것으로 나타났다. 300만원인 공제한도를 채우지 못한 사람들이 적지 않다는 뜻이다. 카드 소득공제는 4분의 1 문턱을 초과하는 액수에 대해 신용카드는 15%, 체크카드는 30%에 해당하는 액수를 300만원 한도로 공제하는 방식이다. 전통시장에서 결제한 금액과 대중교통비에 대해서는 각각 100만원씩 공제 한도가 더 늘어난다. ◇연봉 1억2000만원 이상은 올해부터, 7000만원 이상은 내년부터 공제한도 축소 신용카드 소득공제는 올해부터 순차적으로 한도가 줄어들게 되므로 관련 제도 변화를 유심히 살펴볼 필요가 있다. 고소득자의 공제 폭을 줄여 실질적인 근로소득세 증세(增稅)가 예고돼 있다. 우선 연소득 1억2000만원이 넘는 월급쟁이는 올해 사용분부터 공제한도가 기존 300만원에서 200만원으로 줄어든다. 내년 초 연말정산 때 돌려받는 세금이 수십만원 정도 줄어들거나, 토해내는 세금이 수십만원 늘어난다는 뜻이다. 연봉 7000만~1억2000만원 근로자의 공제 한도는 내년 사용분부터 300만원에서 250만원으로 축소될 전망이다. 연봉 7000만~1억2000만원인 근로자에 대해 정부는 2019년부터 한도를 축소하기로 했지만 지난해 국회가 1년 앞당겨 실시하기로 결정했다.' sentences = self.kkma.sentences(test) for idx in range(0, len(sentences)): if len(sentences[idx]) <= 10: sentences[idx-1] += (' ' + sentences[idx]) sentences[idx] = '' return sentences def get_nouns(self, sentences): nouns = [] for sentence in sentences: if sentence is not '': nouns.append(' '.join([noun for noun in self.twitter.nouns(str(sentence))if noun not in self.stopwords and len(noun) > 1])) return nouns class GraphMatrix(object): def __init__(self): self.tfidf = TfidfVectorizer() self.cnt_vec = CountVectorizer() self.graph_sentence = [] def build_sent_graph(self, sentence): tfidf_mat = self.tfidf.fit_transform(sentence).toarray() self.graph_sentence = np.dot(tfidf_mat, tfidf_mat.T) return self.graph_sentence def build_words_graph(self, sentence): cnt_vec_mat = normalize(self.cnt_vec.fit_transform(sentence).toarray().astype(float), axis=0) vocab = self.cnt_vec.vocabulary_ return np.dot(cnt_vec_mat.T, cnt_vec_mat), {vocab[word] : word for word in vocab} class Rank(object): def get_ranks(self, graph, d=0.85): A = graph matrix_size = A.shape[0] for id in range(matrix_size): A[id, id] = 0 link_sum = np.sum(A[:,id]) if link_sum != 0: A[:, id] /= link_sum A[:, id] *= -d A[id, id] = 1 B = (1-d) * np.ones((matrix_size, 1)) print('ranks') ranks = np.linalg.solve(A, B) # 연립방정식 Ax = b print('stop') return {idx: r[0] for idx, r in enumerate(ranks)} class TextRank(object): def __init__(self): self.sent_tokenize = SentenceTokenizer() self.sentences = self.sent_tokenize.url2sentences() self.nouns = self.sent_tokenize.get_nouns(self.sentences) self.graph_matrix = GraphMatrix() self.sent_graph = self.graph_matrix.build_sent_graph(self.nouns) self.words_graph, self.idx2word = self.graph_matrix.build_words_graph(self.nouns) self.rank = Rank() self.sent_rank_idx = self.rank.get_ranks(self.sent_graph) self.sorted_sent_rank_idx = sorted(self.sent_rank_idx, key=lambda k: self.sent_rank_idx[k], reverse=True) # 믄장 정렬 def summarize(self, sent_num=3): summary = [] index=[] for idx in self.sorted_sent_rank_idx[:sent_num]: index.append(idx) index.sort() for idx in index: summary.append(self.sentences[idx]) return summary def keywords(self, word_num=10): rank = Rank() rank_idx = rank.get_ranks(self.words_graph) sorted_rank_idx = sorted(rank_idx, key=lambda k: rank_idx[k], reverse=True) keywords = [] index=[] for idx in sorted_rank_idx[:word_num]: index.append(idx) for idx in index: keywords.append(self.idx2word[idx]) return keywords print('textrank') textrank = TextRank() print('textrank.summarize') for row in textrank.summarize(3): print(row) print() print('---------------------------------') print('keywords :',textrank.keywords())
여기 ranks 부분까지 출력하고 멈추는거 같습니다
사진에 윈도우,우분투 실행시 화면과 우분투에서 free 명령어 올렸습니다
Forums:
저는 데비안 9에서 해 보았습니다.
저는 데비안 9에서 해 보았습니다.
3.py3은 님께서 올린 소스를 그대로 복사 붙이기 해서 만든 파일이고요.
세벌 https://sebuls.blogspot.kr/
http://ko.lmgtfy.com/?q
http://ko.lmgtfy.com/?q=KoNLPy
http://ko.lmgtfy.com/?q=sklearn
딱 봐도 파이썬 기본 모듈처럼 안 생겼죠?
원 글 작성자님께: python3.[567]-dbg 패키지를 설치한 다음 gdb에 물려서 디버그 정보를 생성해 보세요. 파이썬 자체 문제라면 어디에서 문제가 생겼는지 알 수 있습니다.
답변 감사합니다.
패키지 설치가 되지 않으셔서 그런거 같습니다.
댓글 달기