fix: 修复文档提取报错没有显示的问题

2025-12-26 01:33:05 +00:00 · 2024-11-27 12:17:08 +08:00 · 2024-11-27 12:17:08 +08:00 · 59f5c8ac76
parent 33ed8aa4ae
commit 59f5c8ac76
5 changed files with 8 additions and 6 deletions
--- a/apps/application/flow/step_node/document_extract_node/impl/base_document_extract_node.py
+++ b/apps/application/flow/step_node/document_extract_node/impl/base_document_extract_node.py
@ -29,18 +29,20 @@ class BaseDocumentExtractNode(IDocumentExtractNode):
                    # 回到文件头
                    buffer.seek(0)
                    file_content = split_handle.get_content(buffer)
-                    content.append( '## ' + doc['name'] + '\n' + file_content)
+                    content.append('## ' + doc['name'] + '\n' + file_content)
                    break

        return NodeResult({'content': splitter.join(content)}, {})

    def get_details(self, index: int, **kwargs):
+        # 不保存content全部内容，因为content内容可能会很大
+        content = (self.context.get('content')[:500] + '...') if len(self.context.get('content')) > 0 else ''
        return {
            'name': self.node.properties.get('stepName'),
            "index": index,
            'run_time': self.context.get('run_time'),
            'type': self.node.type,
-            'content': self.context.get('content')[:500] + '...', # 不保存content全部内容，因为content内容可能会很大
+            'content': content,
            'status': self.status,
            'err_message': self.err_message,
            'document_list': self.context.get('document_list')
--- a/apps/common/handle/impl/doc_split_handle.py
+++ b/apps/common/handle/impl/doc_split_handle.py
@ -198,4 +198,4 @@ class DocSplitHandle(BaseSplitHandle):
            return self.to_md(doc, image_list, get_image_id_func())
        except BaseException as e:
            traceback.print_exception(e)
-            return ''
+            return f'{e}'
--- a/apps/common/handle/impl/html_split_handle.py
+++ b/apps/common/handle/impl/html_split_handle.py
@ -70,4 +70,4 @@ class HTMLSplitHandle(BaseSplitHandle):
            return html2text(content)
        except BaseException as e:
            traceback.print_exception(e)
-            return ''
+            return f'{e}'
--- a/apps/common/handle/impl/pdf_split_handle.py
+++ b/apps/common/handle/impl/pdf_split_handle.py
@ -321,4 +321,4 @@ class PdfSplitHandle(BaseSplitHandle):
            return self.handle_pdf_content(file, pdf_document)
        except BaseException as e:
            traceback.print_exception(e)
-            return ''
+            return f'{e}'
--- a/apps/common/handle/impl/text_split_handle.py
+++ b/apps/common/handle/impl/text_split_handle.py
@ -57,4 +57,4 @@ class TextSplitHandle(BaseSplitHandle):
           return buffer.decode(detect(buffer)['encoding'])
        except BaseException as e:
            traceback.print_exception(e)
-            return ''
+            return f'{e}'